1. Startseite
  2. Wissenschaft
  3. Unterschied zu anderen Ansätzen

Was ist der Unterschied zwischen Semantic
Folding und anderen Ansätzen?

Semantic Folding ist der einzige Ansatz zur Text Embedding, der sowohl hohe Genauigkeit als auch Effizienz vereint

Semantic Folding kombiniert die Recheneffizienz von Wortvektormodellen mit der hohen Genauigkeit von Transformer-Modellen - ein echtes Unterscheidungsmerkmal für KI in Unternehmen.

Erste Welle

GloVe, word2Vec, fastText
  • Vorwiegend Wort-Vektoren
  • Primitive Dokumentvektoren durch Mittelung von Wortvektoren
  • Keine Disambiguierung des Wortsinns
  • Rechnerisch effizient
  • Begrenzte Interpretierbarkeit

 

Semantic Folding

Cortical.io
  • Interpretierbare Wort- und Dokumentenvektoren
  • Kontextabhängige Dokumentenvektoren gebildet durch intelligente Kombination von Wortvektoren
    • Bewahrt den Sinn
    • Eliminiert Lärm
  • Rechnerisch effizient

Zweite Welle

BERT, GPT-3, XLNet
  • Kontextualisierte Textvektoren
  • Dokumentenvektoren durch Sequenzlernen
  • Rechnerisch aufwendig
  • Reale Welt Einschränkungen:
    • Umfang des Wortschatzes
    • Länge der Sequenz
    • Modellgröße

Wie schneidet Semantic Folding im Vergleich zu LLMs und ChatGPT ab?

Semantic Folding ist eine alternative Methode für Natural Language Processing , die die Unzulänglichkeiten von LLMs in Bezug auf Zuverlässigkeit, Transparenz, Sicherheit und Nachhaltigkeit behebt. Dieser Ansatz des maschinellen Lernens nutzt die Neurowissenschaften, um Text ähnlich wie unser Gehirn zu verarbeiten, und erfordert deutlich weniger Trainingsdaten und Rechenressourcen als LLMs, um ein ähnliches Maß an Genauigkeit zu erreichen.

Im Gegensatz zu LLMs, die in einem Forschungskontext entwickelt wurden, wurde Semantic Folding für die Lösung von KI-Anwendungsfällen in einem Geschäftskontext konzipiert, insbesondere für Extraktions-, Klassifizierungs-, Such- und Vergleichsaufgaben. Es ist vollständig transparent, ermöglicht eine tiefe Inspektion der Parameter und bietet eine vollständige Erklärbarkeit der Modelle. Aus Sicht des Datenschutzes ist Semantic Folding GDPR-konform: keine Unternehmensdaten werden außerhalb Ihrer Organisation geteilt oder verwendet.

Wie lässt sich der CO2-Fußabdruck von AI verringern?

Dritter KI-Winter steht bevor? Warum OpenAI, Google & Co. in eine Sackgasse laufen

Heute setzen alle großen KI-Unternehmen auf einen Brute-Force-Ansatz. Doch es ist weder effizient noch zukunftssicher, riesige Datenmengen in maschinelle Lernalgorithmen zu füttern und massive Rechenleistung einzusetzen. Die KI muss viel intelligenter und um Größenordnungen effizienter werden, wenn wir einen weiteren Winter vermeiden wollen.

Benchmarks

Semantic Folding Benchmark

Vergleich der Durchsatzleistung der Klassifizierungs-Inferenz-Engine von Cortical.io Semantic Folding mit Google BERT.

Extraktions-Benchmark

Vergleich der Extraktionsleistung eines öffentlichen Datensatzes von Verträgen mit dem Cloud-Extraktionsdienst von Google.

Quantitative Bewertung

Cortical.io SemanticPro übertrifft Google ML sowohl insgesamt als auch bei fast allen Extraktionszielen mit weniger als 100 annotierten Beispielen

F1-Scores auf dem öffentlichen Atticus-Datensatz

    Qualitative Bewertung

    Google ML ist weniger flexibel als zum Beispiel Semantic Folding:

    • Keine Unterstützung für überlappende Extraktionen
    • Maximale Länge der Anmerkungen von 10 Begriffen
    • Maximale Dokumentlänge von 10.000 Zeichen (4-5 Seiten)

    Klassifizierung Benchmark

    Vergleich der Klassifizierungsleistung eines öffentlichen E-Mail-Datensatzes mit verfügbaren NLP-Bibliotheken.

    Cortical.io SemanticPro übertrifft BERT in Bezug auf die Geschwindigkeit um ein vergleichbares Maß an Genauigkeit und übertrifft FastText, Doc2Vec und Word2Vec in Bezug auf die Genauigkeit um vergleichbare Laufzeiten.

    Vorteile von Semantic Folding

    • Hohe Genauigkeit

    Semantic Fingerprints nutzen einen umfangreichen Satz semantischer Merkmale mit 16k Parametern, die eine feinkörnige Disambiguierung von Wörtern und Konzepten ermöglichen.

    • Hohe Effizienz

    Semantic Folding benötigt eine Größenordnung weniger Trainingsdokumente (Hunderte vs. Tausende) und weniger Rechenressourcen, da es spärlich verteilte Vektoren verwendet.

    • Hohe Transparenz und Erklärbarkeit

    Jedes semantische Merkmal kann auf Dokumentenebene überprüft werden, so dass Biases in den Modellen beseitigt und Ergebnisse erklärt werden können.

    • Hohe Flexibilität und Skalierbarkeit

    Semantic Folding kann auf jede Sprache und jeden Anwendungsfall angewendet werden, und Geschäftsanwender können die Modelle leicht anpassen.

    Wie lässt sich der CO2-Fußabdruck von AI verringern?

    Wie lässt sich der CO2-Fußabdruck von AI verringern? (Teil II)

    Artikel lesen

    Semantic Folding Entdecken

    Semantic-Folding-Natural-Language-Understanding

    White Paper Lesen