Hey @hello12345,
Ich würde es so erklären. Es gibt multiple Wege NLG zu realisieren.
1. Retrieval-based: Es gibt Frage-Antwort Paare, die durch eine Anfrage / Query beantwortet werden. Das bedeutet, dass auf eine konkrete Frage eine konkrete Antwort passt wie z.B. Karteikarten oder Vokabeln. Diese Antwort wird in dem Sinne aber nicht "generiert", sondern eher abgerufen und ist vordefiniert. Daher ist die Antwort auch immer "richtig", weil die Antwort quasi in einem Frage-Antwort Speicher abliegt. Wenn es zur Frage keine Antwort gibt bzw. diese nicht im Frage-Antwort-Speicher liegt, gibt es einfach keine Antwort, statt einer möglicherweise falsch generierten Antwort – Ergo: "keine falschen antworten". Somit ist die Fähigkeit Fragen zu beantworten abhängig von der Menge der Frage-Antwort-Paare in dem Speicher.
2. Generation-based: Hierbei versucht das System auch unbekannte Fragen mit passenden Antworten zu beantworten. Das birgt natürlich ein höheres Potenzial für Fehler, da die Antwort nicht vordefiniert ist, sondern vom NGL-System berechnet/generiert wird. Dabei kann die Antwort natürlich auch vollkommen schwachsinnig sein.
Für mich schließt sich Retrieval Based Generation als Wort daher erstmal aus, da das eine tatsächlich generated und das andere eigentlich nur abruft (retrieved). Hilfreich fand ich diesen Artikel dazu:
- https://www.ijcai.org/proceedings/2018/0609.pdf
Es gibt allerdings auch hybride Ansätze, an denen aktuell geforscht wird, siehe:
- https://ai.facebook.com/blog/retrieval-augmented-generation-streamlining-the-creation-of-intelligent-natural-language-processing-models/
- https://arxiv.org/pdf/2005.11401.pdf
- http://aclanthology.lst.uni-saarland.de/D17-1090.pdf
Macht es das klarer? 🤓🤔
Punkte: 45