Modele të hapura Gemma

Një familje e modeleve të hapura të lehta dhe moderne të ndërtuara nga i njëjti kërkim dhe teknologji e përdorur për krijimin e modeleve Gemini

Përgjegjës sipas ikonës së dizajnit

Përgjegjës sipas dizajnit

Duke përfshirë masa gjithëpërfshirëse sigurie, këto modele ndihmojnë në sigurimin e zgjidhjeve të përgjegjshme dhe të besueshme të AI përmes grupeve të të dhënave të kuruara dhe akordimit rigoroz.

Ikona e performancës së pakrahasueshme

Performancë e pakrahasueshme në madhësi

Modelet Gemma arrijnë rezultate të jashtëzakonshme standarde në madhësitë e saj 2B, 7B, 9B dhe 27B, madje duke tejkaluar disa modele më të mëdha të hapura.

Kuadri fleksibël

Vendosje fleksibël

Vendoseni pa probleme në celular, ueb dhe cloud duke përdorur Keras, JAX, MediaPipe, PyTorch, Hugging Face dhe më shumë.

Provoni Gemma 2

E ridizajnuar për performancë të madhe dhe efikasitet të pakrahasueshëm, Gemma 2 optimizon për përfundime të shpejta në pajisje të ndryshme.

5-gjuajtje

MMLU

Standardi MMLU është një test që mat gjerësinë e njohurive dhe aftësinë për zgjidhjen e problemeve të fituara nga modelet e mëdha gjuhësore gjatë para-trajnimit.

25-gjuajtje

ARC-C

Standardi ARC-c është një nëngrup më i fokusuar i grupit të të dhënave ARC-e, që përmban vetëm pyetje të përgjigjura gabimisht nga algoritmet e zakonshme (baza e rimarrjes dhe bashkë-ndodhja e fjalëve).

5-gjuajtje

GSM8K

Standardi GSM8K teston aftësinë e një modeli gjuhësor për të zgjidhur problemet matematikore të nivelit të shkollës që shpesh kërkojnë hapa të shumtë arsyetimi.

3-5-gjuajtje

AGIEval

Standardi AGIEval teston inteligjencën e përgjithshme të një modeli gjuhësor duke përdorur pyetje që rrjedhin nga provimet e botës reale të krijuara për të vlerësuar aftësitë intelektuale të njeriut.

3-shot, CoT

BBH

Standardi BBH (BIG-Bench Hard) fokusohet në detyrat që konsiderohen përtej aftësive të modeleve aktuale të gjuhës, duke testuar kufijtë e tyre në fusha të ndryshme arsyetimi dhe kuptimi.

3-gjuajtje, F1

RËZË

DROP është një pikë referimi e të kuptuarit të leximit që kërkon arsyetim të veçantë mbi paragrafët.

5-gjuajtje

Winogrande

Standardi Winogrande teston aftësinë e një modeli gjuhësor për të zgjidhur detyrat e paqarta të plotësimit të boshllëkut me opsione binare, që kërkojnë arsyetim të përgjithësuar me sens të përbashkët.

10-gjuajtje

HellaSwag

Standardi i HellaSwag sfidon aftësinë e një modeli gjuhësor për të kuptuar dhe zbatuar arsyetimin me sens të përbashkët duke zgjedhur përfundimin më logjik të një historie.

4-gjuajtje

MATEMATIKA

MATH vlerëson aftësinë e një modeli gjuhësor për të zgjidhur probleme komplekse matematikore të fjalëve, që kërkojnë arsyetim, zgjidhje të problemeve me shumë hapa dhe të kuptuarit e koncepteve matematikore.

0-gjuajtje

ARC-e

Standardi ARC-e teston aftësitë e avancuara të përgjigjes së pyetjeve të një modeli gjuhësor me pyetje shkencore të nivelit të mirëfilltë të klasës, me zgjedhje të shumëfishta.

0-gjuajtje

PIQA

Standardi PIQA teston aftësinë e një modeli gjuhësor për të kuptuar dhe zbatuar njohuritë fizike të sensit të përbashkët duke iu përgjigjur pyetjeve në lidhje me ndërveprimet e përditshme fizike.

0-gjuajtje

SIQA

Standardi SIQA vlerëson të kuptuarit e një modeli gjuhësor për ndërveprimet sociale dhe sensin e përbashkët shoqëror duke bërë pyetje rreth veprimeve të njerëzve dhe implikimeve të tyre sociale.

0-gjuajtje

Boolq

Standardi BoolQ teston aftësinë e një modeli gjuhësor për t'iu përgjigjur pyetjeve po/jo që ndodhin natyrshëm, duke testuar aftësinë e modeleve për të kryer detyra konkluzionesh të gjuhës natyrore në botën reale.

5-gjuajtje

TriviaQA

Standardi TriviaQA teston aftësitë e leximit të të kuptuarit me trefishin pyetje-përgjigje-provë.

5-gjuajtje

NQ

Standardi NQ (Pyetjet Natyrore) teston aftësinë e një modeli gjuhësor për të gjetur dhe kuptuar përgjigjet brenda artikujve të tërë të Wikipedia-s, duke simuluar skenarë në botën reale të përgjigjes së pyetjeve.

kaloj@1

HumanEval

Standardi HumanEval teston aftësitë e gjenerimit të kodit të një modeli gjuhësor duke vlerësuar nëse zgjidhjet e tij kalojnë testet e njësive funksionale për problemet e programimit.

3-gjuajtje

MBPP

Standardi MBPP teston aftësinë e një modeli gjuhe për të zgjidhur problemet bazë të programimit Python, duke u fokusuar në konceptet themelore të programimit dhe përdorimin standard të bibliotekës.

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

2.5 B

42.3

Gemma 2

2.6B

51.3

Mistral

7B

62.5

LLAMA 3

8B

66.6

Gemma 1

7B

64.4

Gemma 2

9B

71.3

Gemma 2

27B

75.2

Gemma 1

2.5 B

48.5

Gemma 2

2.6B

55.4

Mistral

7B

60.5

LLAMA 3

8B

59.2

Gemma 1

7B

61.1

Gemma 2

9B

68.4

Gemma 2

27B

71.4

Gemma 1

2.5 B

15.1

Gemma 2

2.6B

23.9

Mistral

7B

39.6

LLAMA 3

8B

45.7

Gemma 1

7B

51.8

Gemma 2

9B

68.6

Gemma 2

27B

74.0

Gemma 1

2.5 B

24.2

Gemma 2

2.6B

30.6

Mistral

7B

44.0

LLAMA 3

8B

45.9

Gemma 1

7B

44.9

Gemma 2

9B

52.8

Gemma 2

27B

55.1

Gemma 1

2.5 B

35.2

Gemma 2

2.6B

41.9

Mistral

7B

56.0

LLAMA 3

8B

61.1

Gemma 1

7B

59.0

Gemma 2

9B

68.2

Gemma 2

27B

74.9

Gemma 1

2.5 B

48.5

Gemma 2

2.6B

52.0

Mistral

7B

63.8

LLAMA 3

8B

58.4

Gemma 1

7B

56.3

Gemma 2

9B

69.4

Gemma 2

27B

74.2

Gemma 1

2.5 B

66.8

Gemma 2

2.6B

70.9

Mistral

7B

78.5

LLAMA 3

8B

76.1

Gemma 1

7B

79.0

Gemma 2

9B

80.6

Gemma 2

27B

83.7

Gemma 1

2.5 B

71.7

Gemma 2

2.6B

73.0

Mistral

7B

83.0

LLAMA 3

8B

82.0

Gemma 1

7B

82.3

Gemma 2

9B

81.9

Gemma 2

27B

86.4

Gemma 1

2.5 B

11.8

Gemma 2

2.6B

15.0

Mistral

7B

12.7

Gemma 1

7B

24.3

Gemma 2

9B

36.6

Gemma 2

27B

42.3

Gemma 1

2.5 B

73.2

Gemma 2

2.6B

80.1

Mistral

7B

80.5

Gemma 1

7B

81.5

Gemma 2

9B

88.0

Gemma 2

27B

88.6

Gemma 1

2.5 B

77.3

Gemma 2

2.6B

77.8

Mistral

7B

82.2

Gemma 1

7B

81.2

Gemma 2

9B

81.7

Gemma 2

27B

83.2

Gemma 1

2.5 B

49.7

Gemma 2

2.6B

51.9

Mistral

7B

47.0

Gemma 1

7B

51.8

Gemma 2

9B

53.4

Gemma 2

27B

53.7

Gemma 1

2.5 B

69.4

Gemma 2

2.6B

72.5

Mistral

7B

83.2

Gemma 1

7B

83.2

Gemma 2

9B

84.2

Gemma 2

27B

84.8

Gemma 1

2.5 B

53.2

Gemma 2

2.6B

59.4

Mistral

7B

62.5

Gemma 1

7B

63.4

Gemma 2

9B

76.6

Gemma 2

27B

83.7

Gemma 1

2.5 B

12.5

Gemma 2

2.6B

16.7

Mistral

7B

23.2

Gemma 1

7B

23.0

Gemma 2

9B

29.2

Gemma 2

27B

34.5

Gemma 1

2.5 B

22.0

Gemma 2

2.6B

17.7

Mistral

7B

26.2

Gemma 1

7B

32.3

Gemma 2

9B

40.2

Gemma 2

27B

51.8

Gemma 1

2.5 B

29.2

Gemma 2

2.6B

29.6

Mistral

7B

40.2

Gemma 1

7B

44.4

Gemma 2

9B

52.4

Gemma 2

27B

62.6

*Këto janë standardet për modelet e trajnuara paraprakisht, shikoni raportin teknik për detaje mbi performancën me metodologji të tjera.

PaliGemma 2 E re

PaliGemma 2 sjell aftësi vizioni lehtësisht të rregullueshme në modelet e gjuhës Gemma 2, duke mundësuar një gamë të gjerë aplikacionesh që kombinojnë kuptimin e tekstit dhe imazhit.

DataGemma

DataGemma janë modelet e para të hapura të krijuara për të lidhur LLM-të me të dhëna të gjera të botës reale të nxjerra nga Data Commons e Google.

Gemma Scope

Gemma Scope u ofron studiuesve transparencë të paparë në proceset vendimmarrëse të modeleve tona Gemma 2.

Eksploroni Gemmaverse

Një ekosistem i gjerë modelesh dhe mjetesh Gemma të krijuara nga komuniteti, gati për të fuqizuar dhe frymëzuar inovacionin tuaj

Ndërtoni

Filloni të ndërtoni me Gemma

Lexoni librin e gatimit Gemma

Shembuj dhe udhëzime praktike për modelet e hapura të Google

Logoja e fytyrës përqafuese

Fytyrë e përqafuar

Kjo fletore demonstron se si të përafrohet një model Gemma-2 duke përdorur DPO (Direct Preference Optimization).

Logoja e NVIDIA

NVIDIA

Rregulloni modelet Gemma me kornizën NVIDIA NeMo dhe eksportoni në TensorRT-LLM për prodhim.

Logoja e Olama

Ollama

Ekzekutoni konkluzionet në nivel lokal në një model Gemma duke përdorur Ollama.

Logo e papunë

i papjekur

Zhbllokoni akordimin e shpejtë dhe efikas të kujtesës Gemma 2 (9B) duke përdorur UnSloth.