Offene Gemma-Modelle
Eine Familie leichter, hochmoderner offener Modelle, die auf derselben Forschung und Technologie basieren, die auch f�r die Erstellung der Gemini-Modelle verwendet wurde
Jetzt neu:
Gemma 2
Gemma 2 wurde für überragende Leistung und unübertroffene Effizienz optimiert und optimiert für blitzschnelle Inferenz auf unterschiedlicher Hardware.
5 Aufnahme
MMLU
Die MMLU-Benchmark ist ein Test, der das Umfang des Wissens und der Problemlösungsfähigkeiten misst, die von Large Language Models während des Vortrainings erworben wurden.
25 Aufnahme
ARC-C
Der ARC-c-Benchmark ist eine spezifischere Teilmenge des ARC-e-Datasets, die nur Fragen enthält, die von gängigen Algorithmen („Retrieval-Base“ und „Co-Vorkommen“) falsch beantwortet wurden.
5 Aufnahme
GSM8K
Mit dem GSM8K-Benchmark wird die Fähigkeit eines Sprachmodells getestet, mathematische Aufgaben für Schuljahre zu lösen, für die häufig mehrere Begründungen erforderlich sind.
3–5-Aufnahmen
AGIEval
Der AGIEval-Benchmark testet die allgemeine Intelligenz eines Sprachmodells anhand von Fragen aus realen Prüfungen zur Bewertung der menschlichen geistigen Fähigkeiten.
3-shot, CoT
BBH
Der BBH-Benchmark (BIG-Bench Hard) konzentriert sich auf Aufgaben, die über die Fähigkeiten der aktuellen Sprachmodelle hinausgehen, und testet ihre Grenzen �ber verschiedene Logik- und Verst�ndnisbereiche hinweg.
Drei Aufnahme, F1
DROP
DROP ist eine Benchmark f�r das Leseverst�ndnis, die diskrete Schlussfolgerungen �ber Abs�tze hinweg erfordert.
5 Aufnahme
Winogrande
Der Winogrande-Benchmark testet die F�higkeit eines Language Models, mehrdeutige Ausf�llaufgaben mit bin�ren Optionen zu l�sen, die allgemeine allgemeine Begr�ndungen erfordern.
10-shot
HellaSwag
Der HellaSwag-Benchmark fordert die F�higkeit eines Sprachmodells, gesunde Schlussfolgerungen zu verstehen und anzuwenden, indem das logische Ende einer Geschichte ausgew�hlt wird.
4 Aufnahme
MATH
MATH bewertet die F�higkeit eines Language Models, komplexe mathematische Textaufgaben zu l�sen, die logisches Denken, eine mehrstufige Probleml�sung und ein Verst�ndnis mathematischer Konzepte erfordern.
0-shot
ARC-e
Der ARC-e-Benchmark testet die fortgeschrittenen F�higkeiten eines Sprachmodells zum Beantworten von Fragen mit echten Multiple-Choice-Fragen f�r Sch�ler und Studenten.
0-shot
PIQA
Der PIQA-Benchmark testet die F�higkeit eines Sprachmodells, physisches allgemeines Wissen zu verstehen und anzuwenden, indem Fragen zu allt�glichen physischen Interaktionen beantwortet werden.
0-shot
SIQA
Der SIQA-Benchmark bewertet das Verst�ndnis eines Language Models von sozialen Interaktionen und sozialem gesundem Menschenverstand, indem Fragen zu den Handlungen von Nutzern und ihren sozialen Auswirkungen gestellt werden.
0-shot
Boolq
Mit dem BoolQ-Benchmark wird die F�higkeit eines Sprachmodells zur Beantwortung nat�rlich auftretender Ja-/Nein-Fragen getestet. Dabei wird getestet, ob das Modell reale Inferenzaufgaben f�r nat�rliche Sprache ausf�hren kann.
5 Aufnahme
TriviaQA
Der TriviaQA-Benchmark testet das Leseverst�ndnis mithilfe von Dreifach-Fragen/Antworten/Beweisen.
5 Aufnahme
NQ
Der NQ-Benchmark (Nat�rliche Fragen) testet die F�higkeit eines Sprachmodells, Antworten in ganzen Wikipedia-Artikeln zu finden und zu verstehen, und simuliert dabei reale Szenarien f�r die Beantwortung von Fragen.
Bestanden@1
HumanEval
Der HumanEval-Benchmark testet die F�higkeiten eines Language Models zur Codegenerierung, indem er bewertet, ob seine L�sungen funktionale Einheitentests f�r Programmierprobleme bestehen.
Drei Aufnahme
MBPP
Der MBPP-Benchmark testet die F�higkeit eines Sprachmodells, grundlegende Python-Programmierprobleme zu l�sen, und konzentriert sich dabei auf grundlegende Programmierkonzepte und die Verwendung von Standardbibliotheken.
100�%
75�%
50�%
25�%
0�%
100�%
75�%
50�%
25�%
0�%
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
LLAMA 3
8 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
Gemma 1
2,5 Mrd.
Gemma 2
2,6 Mrd.
Mistral
7 Mrd.
Gemma 1
7 Mrd.
Gemma 2
9�Mrd.
Gemma 2
27 Mrd.
*Dies sind die Benchmarks f�r die vortrainierten Modelle. Details zur Leistung mit anderen Methoden finden Sie im technischen Bericht.
Gemma-Modellfamilie
Tools entdecken
Kurzanleitungen f�r Entwickler
Kurzanleitungen f�r Partner
Gemma-Rezepte
Entdecken Sie eine Sammlung praktischer Rezepte und Beispiele, die die Leistungsf�higkeit und Vielseitigkeit von Gemma f�r Aufgaben wie Bilduntertitel mit PaliGemma, Codegenerierung mit CodeGemma und das Erstellen von Chatbots mit fein abgestimmten Gemma-Modellen unter Beweis stellen.
Verantwortungsbewusste Entwicklung von KI
Verantwortungsbewusstsein von Anfang an
Mit sorgf�ltig ausgew�hlten Daten vortrainiert und auf Sicherheit abgestimmt, um eine sichere und verantwortungsvolle KI-Entwicklung basierend auf Gemma-Modellen zu erm�glichen.
Robuste und transparente Bewertung
Umfassende Bewertungen und transparente Berichterstattung zeigen die Grenzen des Modells auf, die f�r einen verantwortungsvollen Ansatz f�r jeden Anwendungsfall erforderlich ist.
Verantwortungsvolle Entwicklung f�rdern
Das Toolkit f�r Responsible Generative AI unterst�tzt Entwickler bei der Entwicklung und Implementierung von Best Practices f�r Responsible AI.
F�r Google Cloud optimiert
Mit Gemma-Modellen in Google Cloud k�nnen Sie das Modell mit den vollst�ndig verwalteten Tools von Vertex AI oder der selbstverwalteten Option von GKE umfassend an Ihre spezifischen Anforderungen anpassen und in einer flexiblen und kosteneffizienten KI-optimierten Infrastruktur bereitstellen.
Akademische Forschung mit Google Cloud-Guthaben beschleunigen
Die Bewerbungsfrist f�r das Academic Research Program wurde vor Kurzem beendet. Mit einem Google Cloud-Guthaben k�nnen Forscher mithilfe von Gemma-Modellen die Grenzen der wissenschaftlichen Entdeckung hinaus erweitern. Wir sind gespannt auf die bahnbrechende Forschung, die sich aus dieser Initiative ergibt.
Community beitreten
Vernetzen, entdecken und Ihr Wissen mit anderen in der Community f�r ML-Modelle teilen.