Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Niko Grupen

Dyrektor ds. AI

Vishal Dharmadhikari

AI DevRel

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Branża prawnicza wymaga rozwiązań AI, które potrafią precyzyjnie i z wyczuciem poruszać się po ogromnej ilości złożonych informacji. Tradycyjne testy porównawcze AI często nie odzwierciedlają rzeczywistych potrzeb w praktyce prawniczej, co utrudnia identyfikację modeli, które są naprawdę przydatne w pracy prawnika. Dynamiczny startup Harvey, który zajmuje się przekształcaniem procesów prawnych za pomocą AI, poradził sobie z tym problemem, opracowując BigLaw Bench, czyli kompleksową platformę do oceny wydajności dużych modeli językowych (LLM) w przypadku zadań odzwierciedlających rzeczywistą pracę prawników. W przeprowadzonych niedawno rygorystycznych testach wersja testowa modelu Gemini 2.5 Pro wyróżniła się jako wyjątkowo skuteczna, wykazując niezwykły potencjał w zakresie zwiększania wydajności w kluczowych obszarach prawa.

Wersja testowa Gemini 2.5 Pro wyprzedza konkurencję w branży BigLaw

Ostatnie oceny przeprowadzone przez Harvey z wykorzystaniem struktury BigLaw Bench wyraźnie wykazały, że Gemini 2.5 Pro w wersji testowej wykazuje niezwykłą biegłość w zakresie podstawowych zadań związanych z wnioskowaniem prawnym, a w szczególności w przypadku zadań wymagających wnioskowania na podstawie długich danych wejściowych lub wyjściowych o charakterze prawnym. Jak pokazują publicznie udostępnione wyniki firmy Harvey, uzyskane w ramach testowania modeli, w tym Gemini 2.5 Pro Preview, za pomocą odpowiednich interfejsów API, model Gemini 2.5 Pro Preview osiągnął najwyższy wynik – 85,02% – w teście BigLaw Bench, wyprzedzając inne modele oceniane w ramach tego kompleksowego testu.

Tekst alternatywny: wykres słupkowy zatytułowany

Ta zaawansowana funkcja jest kluczowa w przypadku wielu cennych działań prawnych. Najważniejsze zadania oceny w ramach BigLaw Bench pokazały mocne strony wersji testowej Gemini 2.5 Pro:

Należyta staranność w przypadku transakcji: wersja podglądowa Gemini 2.5 Pro wykazała dużą zdolność do wyodrębniania i podsumowywania kluczowych postanowień (np. dotyczących przeniesienia praw, odszkodowania, klauzul wypowiedzenia) z wielu długich umów o świadczenie usług. Sugeruje to znaczny potencjał w zakresie usprawnienia czasochłonnego procesu ręcznego sprawdzania dokumentów.
Strukturyzacja transakcji: model sprawnie generował kompleksowe, dobrze skonstruowane analizy porównawcze złożonych opcji finansowych (np. PIPE, gwarantowane oferty akcji, oferty obligacji). Model ten okazał się obiecujący w zakresie prezentowania tych informacji w jasny i przystępny sposób, nawet dla osób bez specjalistycznej wiedzy finansowej, oraz sugerowania potencjalnych działań do natychmiastowego podjęcia.
Sporządzanie dokumentów procesowych: w przypadku zadań związanych z postępowaniami sądowymi wersja podglądowa Gemini 2.5 Pro wykazała znaczną zdolność do generowania szczegółowych konspektów pism procesowych na podstawie dużych ilości dokumentów. Ta funkcja wskazuje na przyszłość, w której AI będzie mogła znacznie pomagać na początkowych etapach opracowywania i organizowania argumentów prawnych.
Sprawdzanie i analiza dokumentów: oceny obejmujące sprawdzanie różnych dokumentów próbnych (dzienników połączeń, e-maili, notatek) wykazały, że Gemini 2.5 Pro Preview dobrze radzi sobie z tworzeniem spójnych podsumowań chronologicznych zdarzeń. Model wykazał też potencjał w zakresie identyfikowania w dokumentach krytycznych niespójności i niejasności, co jest kluczowym aspektem dokładnej analizy prawnej.

Podczas tych testów model Gemini 2.5 Pro Preview wykazał dużą zdolność rozumowania w przypadku danych wejściowych składających się z setek stron materiałów, co jest typowym scenariuszem w pracy prawniczej. Dodatkowo potrafił wykorzystywać te materiały do generowania dłuższych i bardziej wyczerpujących wyników, co pozwalało na uzyskanie bardziej szczegółowych informacji i analiz. Te podstawowe możliwości pokazują potencjał wykorzystania Gemini 2.5 Pro Preview w złożonych pracach prawnych wymagających wnioskowania na podstawie dużych zbiorów dokumentów, aby wspierać przypadki użycia związane z należytą starannością, przeglądaniem i przygotowywaniem dokumentów.

Nowy standard w zakresie AI w branży prawniczej

„W Harvey dokładamy wszelkich starań, aby zapewnić prawnikom dostęp do najbardziej zaawansowanych narzędzi” – mówi Niko Grupen, szef działu Applied AI w Harvey. „Nasza ocena wersji podglądowej Gemini 2.5 Pro w ramach BigLaw Bench wykazała niezwykłą zdolność tego modelu do syntezy złożonych informacji prawnych. Ta wiedza napędza naszą wizję przyszłego rozwoju produktu, w której zamierzamy wykorzystać te mocne strony, aby osiągnąć niespotykaną dotąd wydajność i umożliwić prawnikom skupienie się na strategicznych zadaniach wyższego poziomu”.

Odkrywanie przyszłości pracy prawniczej

Zaangażowanie firmy Harvey w przeprowadzanie rygorystycznych ocen i jej wnikliwe analizy najnowocześniejszych modeli AI, takich jak Gemini 2.5 Pro w wersji przedpremierowej, pokazują transformacyjny potencjał AI w dziedzinie prawa. Ich odkrycia otwierają drogę do przyszłych innowacji, które mogą zmienić sposób, w jaki prawnicy podchodzą do najbardziej wymagających zadań.

Aby dowiedzieć się, jak zaawansowane funkcje rozumowania i syntezy w wersji podglądowej Gemini 2.5 Pro mogą usprawnić Twoje aplikacje, zapoznaj się z dokumentacją Gemini API lub zacznij korzystać z Google AI Studio.

Harvey jest uczestnikiem Funduszu AI od Google, który inwestuje w ambitne startupy tworzące przyszłość AI i z nimi współpracuje.

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Wersja testowa Gemini 2.5 Pro wyprzedza konkurencję w branży BigLaw

Nowy standard w zakresie AI w branży prawniczej

Odkrywanie przyszłości pracy prawniczej

Powiązane studia przypadków