Google AI Edge Portal: Edge-KI im großen Maßstab benchmarken. Melden Sie sich an, um während der privaten Vorschau Zugriff anzufordern.

GpuDelegateFactory.Options

Öffentliche statische Klasse GpuDelegateFactory.Options

Bekannte direkte Unterklassen

GpuDelegate.Options

Optionen delegieren

Verschachtelte Klassen

enum GpuDelegateFactory.Options.GpuBackend GPU-Backend, das ausgewählt werden soll.

Konstanten

int	INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER	Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.
int	INFERENCE_PREFERENCE_SUSTAINED_SPEED	Bevorzugen Sie, den Durchsatz zu maximieren.

Public Constructors

Options()

Public Methods

boolean	areQuantizedModelsAllowed()
GpuDelegateFactory.Options.GpuBackend	getForceBackend()
int	getInferencePreference()
String	getModelToken()
String	getSerializationDir()
boolean	isPrecisionLossAllowed()
GpuDelegateFactory.Options	setForceBackend(GpuDelegateFactory.Options.GpuBackend erzwingen Backend) Legt das GPU-Back-End fest.
GpuDelegateFactory.Options	setInferencePreference(int-Präferenz) Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
GpuDelegateFactory.Options	setPrecisionLossAllowed(boolesche PräzisionLossAllowed) Legt fest, ob ein Genauigkeitsverlust zulässig ist.
GpuDelegateFactory.Options	setQuantizedModelsAllowed(boolesch, quantizedModelsAllowed) Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
GpuDelegateFactory.Options	setSerializationParams(String serializationDir, String modelToken) Aktiviert die Serialisierung im Delegaten.

Übernommene Methoden

Aus Klasse java.lang.Object

boolean	equals(Objekt arg0)
final Class<?>	getClass()
int	hashCode()
endgültig void	notify()
endgültig void	notifyAll()
String	toString()
endgültig void	wait(long arg0, int arg1)
endgültig void	wait(lange arg0)
endgültig void	wait()

Konstanten

public static final Ganzzahl INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.

Konstanter Wert: 0

public static final Ganzzahl INFERENCE_PREFERENCE_SUSTAINED_SPEED

Bevorzugen Sie, den Durchsatz zu maximieren. Derselbe Delegate wird bei mehreren Eingaben wiederholt verwendet.

Konstanter Wert: 1

Public Constructors

public Optionen ()

Public Methods

public boolesch areQuantizedModelsAllowed ()

public GpuDelegateFactory.Options.GpuBackend getForceBackend ()

public int getInferencePreference ()

public String getModelToken ()

public String getSerializationDir ()

public boolesch isPrecisionLossAllowed ()

public GpuDelegateFactory.Options setForceBackend (GpuDelegateFactory.Options.GpuBackend forceBackend)

Legt das GPU-Back-End fest.

Parameter

forceBackend

public GpuDelegateFactory.Options setInferencePreference (int-Präferenz)

Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.

Parameter

Einstellung	Eine von „INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER“ (Standard), „INFERENCE_PREFERENCE_SUSTAINED_SPEED“.

public GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)

Legt fest, ob ein Genauigkeitsverlust zulässig ist.

Parameter

precisionLossAllowed	Wenn „true“ (Standard) festgelegt ist, kann die GPU Tensoren, herabgestufte Werte und die Verarbeitung in FP16 quantifizieren. Bei „false“ werden Berechnungen in 32-Bit-Gleitkommazahlen ausgeführt.

public GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)

Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.

WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.

Parameter

quantizedModelsAllowed	Wenn `true` (Standardeinstellung) ist, kann die GPU quantisierte Modelle ausführen.

public GpuDelegateFactory.Options setSerializationParams (String serializationDir, String modelToken)

Aktiviert die Serialisierung im Delegaten. Beachten Sie, dass serializationDir und modelToken, die nicht null sind, für die Serialisierung erforderlich sind.

WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.

Parameter

serializationDir	Das Verzeichnis, das zum Speichern von Daten verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Modell nicht in einem öffentlichen Verzeichnis gespeichert wird. Es empfiehlt sich, unter Android mit `Context.getCodeCacheDir()` einen privaten Standort für die App anzugeben.
modelToken	Das Token, das zur Identifizierung des Modells verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Token für die Modellgrafik und die Modelldaten eindeutig ist.