| Bekannte direkte Unterklassen |
Optionen delegieren
Verschachtelte Klassen
| enum | GpuDelegateFactory.Options.GpuBackend | GPU-Backend, das ausgewählt werden soll. | |
Konstanten
| int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden. |
| int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Bevorzugen Sie, den Durchsatz zu maximieren. |
Public Constructors
|
Options()
|
Public Methods
| boolean | |
| GpuDelegateFactory.Options.GpuBackend | |
| int | |
| String | |
| String | |
| boolean | |
| GpuDelegateFactory.Options |
setForceBackend(GpuDelegateFactory.Options.GpuBackend erzwingen Backend)
Legt das GPU-Back-End fest.
|
| GpuDelegateFactory.Options |
setInferencePreference(int-Präferenz)
Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
|
| GpuDelegateFactory.Options |
setPrecisionLossAllowed(boolesche PräzisionLossAllowed)
Legt fest, ob ein Genauigkeitsverlust zulässig ist.
|
| GpuDelegateFactory.Options |
setQuantizedModelsAllowed(boolesch, quantizedModelsAllowed)
Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
|
| GpuDelegateFactory.Options |
setSerializationParams(String serializationDir, String modelToken)
Aktiviert die Serialisierung im Delegaten.
|
Übernommene Methoden
Konstanten
public static final Ganzzahl INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.
public static final Ganzzahl INFERENCE_PREFERENCE_SUSTAINED_SPEED
Bevorzugen Sie, den Durchsatz zu maximieren. Derselbe Delegate wird bei mehreren Eingaben wiederholt verwendet.
Public Constructors
public Optionen ()
Public Methods
public boolesch areQuantizedModelsAllowed ()
public int getInferencePreference ()
public boolesch isPrecisionLossAllowed ()
public GpuDelegateFactory.Options setForceBackend (GpuDelegateFactory.Options.GpuBackend forceBackend)
Legt das GPU-Back-End fest.
Parameter
| forceBackend |
|---|
public GpuDelegateFactory.Options setInferencePreference (int-Präferenz)
Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
Parameter
| Einstellung | Eine von „INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER“ (Standard), „INFERENCE_PREFERENCE_SUSTAINED_SPEED“. |
|---|
public GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)
Legt fest, ob ein Genauigkeitsverlust zulässig ist.
Parameter
| precisionLossAllowed | Wenn „true“ (Standard) festgelegt ist, kann die GPU Tensoren, herabgestufte Werte und die Verarbeitung in FP16 quantifizieren. Bei „false“ werden Berechnungen in 32-Bit-Gleitkommazahlen ausgeführt. |
|---|
public GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)
Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.
Parameter
| quantizedModelsAllowed | Wenn true (Standardeinstellung) ist, kann die GPU quantisierte Modelle ausführen.
|
|---|
public GpuDelegateFactory.Options setSerializationParams (String serializationDir, String modelToken)
Aktiviert die Serialisierung im Delegaten. Beachten Sie, dass serializationDir und modelToken, die nicht null sind, für die Serialisierung erforderlich sind.
WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.
Parameter
| serializationDir | Das Verzeichnis, das zum Speichern von Daten verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Modell nicht in einem öffentlichen Verzeichnis gespeichert wird. Es empfiehlt sich, unter Android mit Context.getCodeCacheDir() einen privaten Standort für die App anzugeben. |
|---|---|
| modelToken | Das Token, das zur Identifizierung des Modells verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Token für die Modellgrafik und die Modelldaten eindeutig ist. |