Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

निको ग्रुपेन

अप्लाइड एआई के हेड

विशाल धर्माधिकारी

AI DevRel

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

कानूनी क्षेत्र में, एआई के ऐसे समाधानों की ज़रूरत होती है जो जटिल जानकारी को सटीक और बारीकी से समझ सकें. एआई के लिए तय किए गए पारंपरिक बेंचमार्क, अक्सर कानूनी काम से जुड़ी असल दुनिया की ज़रूरतों को पूरा नहीं कर पाते. इसलिए, ऐसे मॉडल की पहचान करना मुश्किल हो जाता है जो कानूनी काम को बेहतर तरीके से कर सकते हैं. Harvey, एक डाइनैमिक स्टार्टअप है. यह एआई की मदद से, कानूनी वर्कफ़्लो को बेहतर बनाने के लिए काम करता है. इसने इस समस्या को हल करने के लिए, BigLaw Bench को डेवलप किया है. यह एक ऐसा फ़्रेमवर्क है जो कानूनी काम से मिलते-जुलते टास्क पर, लार्ज लैंग्वेज मॉडल (एलएलएम) की परफ़ॉर्मेंस का आकलन करता है. हाल ही में किए गए कड़े आकलन में, Gemini 2.5 Pro Preview ने बेहतरीन परफ़ॉर्मेंस दिखाई है. इससे पता चलता है कि यह कानूनी मामलों से जुड़े मुख्य विषयों में, काम को बेहतर तरीके से करने की क्षमता रखता है.

BigLaw Bench पर Gemini 2.5 Pro का प्रीव्यू

हाल ही में, BigLaw Bench फ़्रेमवर्क का इस्तेमाल करके Harvey के परफ़ॉर्मेंस का आकलन किया गया. इससे पता चला कि Gemini 2.5 Pro Preview, कानूनी मामलों से जुड़े मुख्य तर्कों को समझने में काफ़ी बेहतर है. साथ ही, यह खास तौर पर उन मामलों में बेहतर है जिनमें कानूनी मामलों से जुड़े लंबे इनपुट या आउटपुट को समझने की ज़रूरत होती है. सार्वजनिक तौर पर शेयर किए गए Harvey के नतीजों में दिखाया गया है कि Gemini 2.5 Pro Preview ने BigLaw Bench पर 85.02% का सबसे ज़्यादा स्कोर हासिल किया है. ये नतीजे, Gemini 2.5 Pro Preview के साथ-साथ अन्य मॉडल को उनके एपीआई के ज़रिए टेस्ट करके हासिल किए गए हैं. इस तरह, Gemini 2.5 Pro Preview ने इस पूरी तरह से किए गए आकलन में, अन्य मॉडल से बेहतर परफ़ॉर्म किया है.

यह सुविधा, कानूनी तौर पर की जाने वाली कई अहम गतिविधियों के लिए बहुत ज़रूरी है. BigLaw Bench में शामिल मुख्य टास्क के आकलन से, Gemini 2.5 Pro Preview की क्षमताओं का पता चला:

लेन-देन से जुड़ी ज़रूरी जांच: Gemini 2.5 Pro Preview में, सेवा से जुड़े कई लंबे समझौतों से ज़रूरी प्रावधानों (जैसे, असाइनमेंट, क्षतिपूर्ति, समझौते खत्म करने से जुड़ी शर्तें) को निकालने और उनकी खास जानकारी देने की बेहतरीन क्षमता दिखी. इससे पता चलता है कि मैन्युअल तरीके से दस्तावेज़ की समीक्षा करने में लगने वाले समय को कम किया जा सकता है.
लेन-देन का स्ट्रक्चर तैयार करना: मॉडल ने जटिल फ़ाइनेंशियल विकल्पों (जैसे, PIPE, अंडरराइट किए गए इक्विटी ऑफ़र, बॉन्ड ऑफ़र). मॉडल ने इस जानकारी को साफ़ तौर पर और आसानी से समझने लायक तरीके से पेश किया. यह जानकारी उन लोगों के लिए भी आसानी से समझी जा सकती है जिन्हें वित्तीय मामलों की ज़्यादा जानकारी नहीं है. साथ ही, मॉडल ने तुरंत कार्रवाई करने के लिए सुझाव भी दिए.
मुकदमे से जुड़े दस्तावेज़ तैयार करना: मुकदमे से जुड़े टास्क के लिए आकलन करने पर, Gemini 2.5 Pro Preview ने कानूनी जानकारी देने वाले दस्तावेज़ों के आधार पर, कानूनी जानकारी देने वाले नोट के लिए विस्तृत आउटलाइन जनरेट करने की बेहतरीन क्षमता दिखाई. इस सुविधा से पता चलता है कि आने वाले समय में, एआई कानूनी तर्क तैयार करने और उन्हें व्यवस्थित करने के शुरुआती चरणों में काफ़ी मदद कर सकता है.
दस्तावेज़ की समीक्षा और विश्लेषण: अलग-अलग ट्रायल दस्तावेज़ों (कॉल लॉग, ईमेल, ज्ञापन) की समीक्षा से पता चला कि Gemini 2.5 Pro Preview, घटनाओं के क्रम के हिसाब से सारांश बनाने में बेहतर है. इसके अलावा, मॉडल ने रिकॉर्ड में मौजूद गंभीर विसंगतियों और अस्पष्टताओं की पहचान करने में भी मदद की. यह कानूनी विश्लेषण का एक अहम पहलू है.

इन सभी आकलन में, Gemini 2.5 Pro Preview ने तर्क करने की बेहतरीन क्षमता दिखाई. इसके लिए, सैकड़ों पेजों के इनपुट का इस्तेमाल किया गया. कानूनी काम में ऐसा अक्सर होता है. इसके अलावा, यह इन सामग्रियों का इस्तेमाल करके, ज़्यादा शब्दों में और पूरी जानकारी के साथ जवाब जनरेट कर सकता था. इससे ज़्यादा अहम जानकारी और विश्लेषण मिल पाते थे. इन मुख्य क्षमताओं से पता चलता है कि Gemini 2.5 Pro Preview का इस्तेमाल, कानूनी मामलों से जुड़े मुश्किल कामों के लिए किया जा सकता है. इसके लिए, बड़े दस्तावेज़ों के सेट पर तर्क करने की ज़रूरत होती है, ताकि जांच, समीक्षा, और ड्राफ़्टिंग के इस्तेमाल के मामलों में मदद मिल सके.

कानूनी एआई के लिए नया स्टैंडर्ड

Harvey के हेड ऑफ़ अप्लाइड एआई, निको ग्रुपेन कहते हैं,"Harvey में, हम कानूनी पेशेवरों को सबसे आधुनिक टूल उपलब्ध कराने के लिए प्रतिबद्ध हैं." "BigLaw Bench के ज़रिए Gemini 2.5 Pro Preview का आकलन करने पर, हमें पता चला है कि यह मुश्किल कानूनी जानकारी को इकट्ठा करने में काफ़ी बेहतर है. इस अहम जानकारी से, हमें आने वाले समय में प्रॉडक्ट डेवलपमेंट के लिए दिशा मिलती है. हमारा लक्ष्य इन खूबियों का इस्तेमाल करके, अभूतपूर्व दक्षता हासिल करना है. साथ ही, वकीलों को ज़्यादा अहम रणनीतिक काम पर ध्यान देने में मदद करना है."

कानूनी काम के भविष्य को अनलॉक करना

Harvey, एआई मॉडल का बारीकी से आकलन करने और Gemini 2.5 Pro Preview जैसे बेहतरीन एआई मॉडल का विश्लेषण करने के लिए प्रतिबद्ध है. इससे पता चलता है कि कानूनी क्षेत्र में एआई कितना मददगार हो सकता है. उनकी खोजों से, आने वाले समय में नई तकनीकें विकसित करने में मदद मिलेगी. इससे कानूनी पेशेवरों को अपने सबसे मुश्किल कामों को पूरा करने के तरीके में बदलाव करने में मदद मिलेगी.

Gemini 2.5 Pro Preview की बेहतर रीज़निंग और सिंथेसिस की क्षमताओं के बारे में जानने के लिए, Gemini API का दस्तावेज़ पढ़ें या Google AI Studio में जाकर इसे आज़माएँ.

Harvey, Google के एआई फ़्यूचर्स फ़ंड में शामिल है. यह फ़ंड, एआई के क्षेत्र में नए-नए प्रयोग करने वाले स्टार्टअप में निवेश करता है और उनके साथ मिलकर काम करता है.

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

BigLaw Bench पर Gemini 2.5 Pro का प्रीव्यू

कानूनी एआई के लिए नया स्टैंडर्ड

कानूनी काम के भविष्य को अनलॉक करना

मिलती-जुलती केस स्टडी