Szybsze odkrywanie dzięki Gemini for Research
Modele Gemini mogą być wykorzystywane do prowadzenia podstawowych badań w różnych dziedzinach. Oto sposoby, w jakie możesz wykorzystać Gemini do prowadzenia badań:
- Dostrajanie: możesz dostrajać modele Gemini w różnych trybach, aby rozwijać swoje badania. Więcej informacji
- Analizowanie i kontrolowanie wyników modelu: aby przeprowadzić dalszą analizę, możesz sprawdzić kandydata na odpowiedź wygenerowanego przez model za pomocą narzędzi takich jak
Logprobs
iCitationMetadata
. Możesz też skonfigurować opcje generowania modelu i danych wyjściowych, takie jakresponseSchema
,topP
itopK
. Więcej informacji - Dane wejściowe multimodalne: Gemini może przetwarzać obrazy, dźwięk i filmy, co otwiera wiele nowych możliwości badawczych. Więcej informacji
- Możliwości długiego kontekstu: Gemini 1.5 Flash ma okno kontekstu o wielkości 1 mln tokenów, a Gemini 1.5 Pro – 2 mln tokenów. Więcej informacji
- Grow with Google: szybki dostęp do modeli Gemini za pomocą interfejsu API i Google AI Studio na potrzeby zastosowań produkcyjnych. Jeśli szukasz platformy opartej na Google Cloud, Vertex AI może zapewnić dodatkową infrastrukturę pomocniczą.
Aby wspierać badania naukowe i prowadzić innowacyjne badania, Google udostępnia naukowcom i badaczom akademickim środki do wykorzystania w interfejsie Gemini API w ramach programu akademickiego Gemini.
Pierwsze kroki z Gemini
Gemini API i Google AI Studio pomogą Ci zacząć korzystać z najnowszych modeli Google i przekształcać pomysły w aplikacje, które można skalować.
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.0-flash",
contents="How large is the universe?",
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-2.0-flash",
contents: "How large is the universe?",
});
console.log(response.text);
}
await main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Polecani naukowcy
„W naszych badaniach analizujemy Gemini jako wizualny model językowy (VLM) i jego zachowania agentowe w różnych środowiskach z perspektywy niezawodności i bezpieczeństwa. Do tej pory oceniliśmy odporność Gemini na rozpraszacze, takie jak wyskakujące okienka, gdy agenci VLM wykonują zadania na komputerze, a także wykorzystaliśmy Gemini do analizowania interakcji społecznych, zdarzeń czasowych i czynników ryzyka na podstawie danych wejściowych wideo”.
„Modele Gemini Pro i Flash z długim oknem kontekstu pomagają nam w projekcie OK-Robot, czyli projekcie manipulacji mobilnej z otwartym słownictwem. Gemini umożliwia złożone zapytania i polecenia w języku naturalnym dotyczące „pamięci” robota, czyli w tym przypadku wcześniejszych obserwacji dokonanych przez robota w długim okresie działania. Mahi Shafiullah i ja również używamy Gemini do dzielenia zadań na kod, który robot może wykonywać w świecie rzeczywistym”.
Program akademicki Gemini
Kwalifikujący się naukowcy (np. wykładowcy, pracownicy i doktoranci) w obsługiwanych krajach mogą ubiegać się o kredyty na interfejs Gemini API i wyższe limity liczby żądań w przypadku projektów badawczych. Dzięki temu można zwiększyć przepustowość eksperymentów naukowych i usprawnić badania.
Szczególnie interesują nas obszary badań wymienione w następnej sekcji, ale przyjmujemy zgłoszenia z różnych dziedzin nauki:
Oceny i wartości referencyjne: metody oceny zatwierdzone przez społeczność, które mogą dostarczać silnych sygnałów dotyczących skuteczności w zakresach takich jak rzetelność, bezpieczeństwo, wykonywanie instrukcji, rozumowanie i planowanie.
Przyspieszanie odkryć naukowych z korzyścią dla ludzkości: potencjalne zastosowania AI w interdyscyplinarnych badaniach naukowych, w tym w obszarach takich jak rzadkie i zaniedbane choroby, biologia eksperymentalna, materiałoznawstwo i zrównoważony rozwój.
Ucieleśnienie i interakcje: wykorzystanie dużych modeli językowych do badania nowych interakcji w dziedzinach ucieleśnionej AI, interakcji otoczenia, robotyki i interakcji człowiek–komputer.
Nowe możliwości: badanie nowych funkcji agentowych wymaganych do ulepszenia rozumowania i planowania oraz sposobów rozszerzania możliwości podczas wnioskowania (np. przez wykorzystanie Gemini Flash).
Interakcja i rozpoznawanie multimodalne: identyfikowanie luk i możliwości w zakresie multimodalnych modeli podstawowych do analizowania, wnioskowania i planowania w różnych zadaniach.
Kryteria kwalifikacji: zgłoszenia mogą przesyłać tylko osoby fizyczne (wykładowcy, badacze lub osoby o podobnych kwalifikacjach) powiązane z akredytowaną instytucją akademicką lub organizacją badawczą. Pamiętaj, że dostęp do interfejsu API i kredyty będą przyznawane i usuwane według uznania Google. Zgłoszenia sprawdzamy co miesiąc.