ChatGPT kennt und nutzt inzwischen fast jeder. Aber kennst du auch Alternativen zu ChatGPT, die in vielen Anwendungen sogar oft besser sind?
Die rasante Entwicklung der Künstlichen Intelligenz bringt ständig neue KI-Tools hervor, so auch zahlreiche sehr interessante Sprachmodelle als Alternative zu ChatGPT, die sowohl für die Unterrichtsvorbereitung aber auch für den Unterricht gut geeignet sind.
Die Sprachmodelle werden immer besser und ChatGPT bekommt endlich ernsthaft Konkurrenz mit Claude 3.5, Gemini, Copilot und Perplexity. Aber welches dieser Modelle eignet sich am besten für den Einsatz für Lehrende und im Unterricht? Ich führe daher den praxisorientierten KI Chatbot Test durch: In diesem Blogbeitrag treten vier der führenden Sprachmodelle des Jahres 2024 gegeneinander an: ChatGPT 4o vs. Claude 3,5 vs. Gemini vs. Copilot vs. Perplexity.
Jedes dieser Tools hat seine eigenen Stärken. Sie sind ohne Frage alle ein echtes Upgrade für Lehrende, Dozenten, Trainer:innen und Ausbilder. Doch es gibt durchaus Unterschiede. Um herauszufinden, welches am besten performt, werde ich drei spannende Tests starten.
Bereit für eine spannende Reise in die Welt der Sprachmodelle? Dann lass uns loslegen!
Sprachmodelle sind KI-basierte Systeme, die darauf trainiert wurden, menschliche Sprache zu verstehen und zu generieren. Sie nutzen riesige Datenmengen und komplexe Algorithmen, um Texte zu analysieren und darauf basierend sinnvolle Antworten zu erstellen. Diese Modelle können in verschiedenen Bereichen eingesetzt werden, von der einfachen Textgenerierung bis hin zur komplexen Datenanalyse. Alle Sprachmodelle werden schriftlich oder mündlich, über einen Chat im Browser oder in einer App, bedient
Sprachmodelle sind aus meinem und den Alltag vieler Anwender:innen nicht mehr wegzudenken. Sie unterstützen bei der Unterrichtsplanung, Erstellung von Lernmaterialien, begleiten die Lernenden, sorgen für abwechslungsreichen Unterricht und erleichtern ständig wiederkehrende Alltagsaufgaben. Darüber hinaus können sie im Unterricht selbst eingesetzt werden, um Schüler*innen zu motivieren und zu fördern.
Nutzen für die Unterrichtsplanung und Organisation
Anwendung im Unterricht
Sprachmodelle sind in der modernen Bildung unverzichtbar geworden. Hier ist eine Übersicht der führenden Sprachmodelle und deren Besonderheiten:
ChatGPT, das bekannteste Sprachmodell, entwickelt von OpenAI, ist ein leistungsstarkes Sprachmodell, das darauf spezialisiert ist, menschenähnliche Texte zu generieren. ChatGPT kann eine Vielzahl von Textformaten erstellen und ist besonders gut darin, kreative und informative Inhalte zu generieren. Es kann schnell große Mengen an Text verarbeiten und verständliche Erklärungen liefern. Im Beitrag ChatGPT als Assistent und ChatGPT im Unterricht, bekommst du viele Informationen, wie ChatGPT dich bei deiner Arbeit unterstützen kann.
Das Modell kann gelegentlich falsche oder irreführende Informationen liefern, da es keine eigene Datenbank hat, sondern auf die Trainingsdaten angewiesen ist.
Um ChatGPT nutzen zu können, ist eine Anmeldung mit Name, Geburtsdatum und Handynummer bei OpenAI notwendig. Das Modell kann dann in der kostenfreien Version ChatGPT 3.5 und ChatGPT 4o genutzt werden.
Copilot ist ein KI-Assistent, der in Microsoft 365 integriert ist und speziell entwickelt wurde, um Benutzer bei verschiedenen Aufgaben direkt zu unterstützen, wie z.B. Textverarbeitung, Tabellenkalkulation und Präsentationserstellung. Copilot kann aber auch über den Browser genutzt werden, idealerweise über Microsoft Bing, geht aber auch mit allen anderen Browsern.
Die nahtlose Integration in die Microsoft 365-Suite macht es sehr benutzerfreundlich. Es kann Routineaufgaben automatisieren und Vorschläge zur Verbesserung von Dokumenten liefern.
Copilot ist kostenfrei über den Browser anwendbar, allerdings sind nicht alle Funktionen nutzbar.
Perplexity AI ist darauf spezialisiert, komplexe Informationen zu durchsuchen und verständliche Zusammenfassungen zu erstellen. Es eignet sich hervorragend für die Recherche und Datenanalyse. Perplexity durchsucht das Internet und youTube nach Informationen und zeigt dir die Quellenangaben bei den Antworten an. Das macht es zu einem starken Werkzeug für Recherchen und zur Erstellung von aktuellen Informationen in Texten.
Das Modell ist vor allem auf textbasierte Daten beschränkt und teilweise weniger flexibel in der Erzeugung kreativer Inhalte.
Perplexity kann ohne Anmeldung sehr umfangreich genutzt werden und ist daher auch sehr gut für den Einsatz im Unterricht geeignet. Möchtest du mehr zu Perplexity wissen, dann schau doch mal in diesen Beitrag.
Gemini ist ein Sprachmodell aus dem Hause Google, das sowohl Text- als auch Bilddaten verarbeiten kann. Diese Fähigkeit macht es besonders vielseitig in der Anwendung. Gemini greift für seine Informationen auf Google zu und stellt Quellenangaben zur Verfügung.
Die multimodale Verarbeitung ermöglicht es, sowohl Texte als auch Bilder zu interpretieren und zu generieren. Dies ist besonders nützlich für visuelle Lerninhalte und interaktive Projekte.
Gemini ist nur über die Anmeldung eines Google Accounts nutzbar und kann daher nur eingeschränkt im Unterricht eingesetzt werden, da nicht alle Lernenden einen Goolge Account haben.
Claude ist ein weiteres fortschrittliches Sprachmodell von Anthropic, welches seit Mai 2024 auch in Deutschland auf dem Markt ist. Es kann sowohl Texte, Bilder und Code verarbeiten und generieren. Es ist besonders gut darin, umfassende und kohärente Inhalte zu erstellen.
Claude kann detaillierte und gut strukturierte Texte sowie ansprechende visuelle Inhalte generieren. Es eignet sich hervorragend für Aufgaben, die eine Kombination aus Text und Bild erfordern.
Um Claude zu nutzen ist ebenfalls eine Anmeldung mit Namen, Geburtsdatum und Handynummer notwendig.
Alle Sprachmodelle haben Apps für Smartphones, sowie Browser Erweiterungen. Sie sind kostenfrei nutzbar, allerdings teilweise durch Einschränkungen in den Funktionen.
Immer wieder werde ich meinen Workshops gefragt, welches Sprachmodell das Beste ist.
Gar nicht so einfach! Es gibt zwar Benchmarks (Tabellen und Tools zum Vergleich der Modelle) allerdings, kommt es immer darauf an, was man machen möchte. Ich habe oft mehrere Modelle im Einsatz, um die Ergebnisse zu vergleichen oder mir das Beste aus jeder Antwort zusammen zu schreiben. Mit dem folgenden Vergleich möchte ich dir die unterschiedlichen Stile zeigen, um eine eigene, subjektive Bewertung der Sprachmodelle zu erzielen. So hat das auch den größten Mehrwert für eure tägliche Arbeit.
Mit diesen Tests kriegst du ein besseres Gespür, welches Sprachmodell für welche Aufgabe die Nase vorn hat.
Für den Vergleich habe ich allen Sprachmodellen die selben Aufgaben bearbeiten lassen. Um dir die Funktion und die Unterschiede zu zeigen, generierten die Sprachmodelle eine Unterrichtsplanung, zwei Fallbeispiele und ein Arbeitsblatt.
Im Anschluss habe ich die Ergebnisse analysiert und bewertet. Folgende Kriterien wurden dabei berücksichtigt:
Fangen wir mit der ersten Aufgabe, der Unterrichtsplanung an. Der Prompt dazu lautet:
👩💻 "Du bist eine innovative Lehrperson. Erstelle den Ablauf einer Unterrichtseinheit von 90 Minuten zum Thema Grundlagen der Kommunikation für Auszubildende in der Pflege im 1. Lehrjahr in Tabellenform. Die Lernenden sollen das Thema selbstverantwortlich und kollaborativ erarbeiten. Notiere die Ziele der Lerneinheit und erstelle dann eine Tabelle mit folgenden Spalten: Phase, Inhalt, Aktion LK, Aktion Lernende, Sozialform (SF), Medien, Dauer."
Sehen wir uns jetzt die Ergebnisse der verschiedenen Sprachmodellen an:
Alle Sprachmodelle haben die wesentlichen Inhalte des Themas in der Unterrichtseinheit geplant. Die wichtigsten Ziele sind genannt. Die Zielformulierung von Perplexity und Copilot gefallen mit sehr gut, weil die Ziele an die Taxonomiestufen angelehnt sind.
Der Prompt wurde in allen Sprachmodellen richtig, mit einer Tabelle und den genannten Spalten, umgesetzt. Alle Modelle haben kollaborative Anteile in Form von Gruppenarbeiten integriert. Das Selbstverantwortliche Lernen wurde leider kaum aufgegriffen. Es finden sich Anteile in Form von Recherchieren bei Copilot und Perplexity, sowie als Reflexion der Rollenspiele und Erkenntnisse bei Perplexity, ChatGPT und Copilot.
Die Anwendbarkeit und der Nutzen für den Unterricht ist in allen Unterrichtsplanungen gegeben. Die Auswahl hängt von den persönlichen Vorlieben und dem Stand der Klasse ab. Werfen wir einen Blick auf die Aktionen der Lernenden, dann sind diese mit dem Unterrichtsplan von ChatGPT und Copilot mehr in Aktion mit Recherche, Rollenspielen, Diskussionsanteilen und Reflexion. Am wenigsten gefällt mir der Entwurf von Claude, da dieser sehr monoton ist und kein Transfer auf den Pflegealltag stattfindet. Ich würde mich für den Entwurf von ChatGPT entscheiden, weil dieser abwechslungsreich, aktivierend ist und zu meinem Unterrichtsstil passt.
Bei der Kreativität und Individualität hat kein Modell mit Innovation gepunktet. Alle Entwürfe sind eher Standard Unterrichtseinheiten. Gut gefällt mir der Einstieg bei Gemini, der an die eigenen Erfahrungen anknüpft. Die Recherche, anschließende Erprobung der Techniken und Reflexion der Erkenntnisse bei Perplexity finde ich gut gelungen. Da gibt es kein richtig und falsch - jeder Lehrende wählt die passenden Methoden nach verschiedenen Kriterien aus.
Das Layout als Tabelle wurde in allen Sprachmodellen korrekt umgesetzt. Bei Gemini gibt es noch viele Tipps zur Planung und Gestaltung dazu.
Richtigkeit und Vollständigkeit der Antworten | Umsetzung des Prompts | Anwendbarkeit, Nutzen | Kreativität, Individualität | Layout | |
Perplexity | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
ChatGPT | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Gemini | ⭐️⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Copilot | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Claude | ⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️ | ⭐️⭐️⭐️⭐️ |
Der Prompt für die Generierung der Fallbeispiele für den Vergleich lautet:
👩💻 "Erstelle zwei kurze Fallbeispiele für den Einstieg in das Thema, welches die Bedeutung der Kommunikation in der Pflege verdeutlicht. Die Lernenden sollen zum Nachdenken angeregt werden und an eigene Erfahrungen anknüpfen können. Das Fallbeispiel soll eine Störung im Sender-Empfänger Modell aufgreifen. Das zweite Fallbeispiel soll eine Situation mit einer Störung im nonverbalen Bereich aufzeigen."
Zur besseren Übersicht habe ich nur ein Fallbeispiel abgebildet. Wenn du beide Fallbeispiele lesen möchtest, dann lade dir die Datei runter.
Die Ergebnisse fallen sehr unterschiedlich aus. Sieh selbst:
Alle Sprachmodelle haben zwei kurze Fallbeispiele passend zum Prompt generiert. Die Art und Inhalt der Fallbeispiele ist sehr unterschiedlich. Richtig und vollständig sind alle Fallbeispiele. Die Frage lautet hier, welches eignet sich am Besten für die Anwendung in der Unterrichtsstunde?
Interessant ist, dass die meisten Sprachmodelle zu jedem Fallbeispiel gleich die Analyse oder Aufgaben hinzufügen. Am einfachsten ist das Fallbeispiel von Claude. Das Fallbeispiel von Perplexity entspricht nicht den Erwartungen an ein Fallbeispiel und ist für die Anwendung ungeeignet oder müsste entsprechend angepasst werden. Copilot und ChatGPT erstellen klare Fallbeispiele mit Diskussionsfragen, welche sehr gut für den Einstieg in das Thema geeignet sind. Beide Fallbeispiele von Gemini sind weniger gut geeignet für diese Unterrichtseinheit, sie wirken sehr konstuiert und bieten wenig Möglichkeiten für Diskussion.
Richtigkeit, Vollständigkeit | Umsetzung Prompt | Nutzen, Anwendbarkeit | Individualität, Kreativität | Layout | |
Perplexity | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ |
ChatGPT | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Gemini | ⭐️⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️ |
Copilot | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Claude | ⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ |
Bei den Fallbeispielen punkten ChatGPT und Copilot ganz klar. Die Generierung von Texten aller Art ist ja auch die Stärke dieser beiden Sprachmodelle. Im nächsten Schritt lassen wir uns ein Arbeitsblatt mit verschiedenen Aufgaben stellen. Wer das wohl am besten meistert?
👩💻 "Erstelle ein Arbeitsblatt mit 2 Fragen zum Sender-Empfänger Modell, 3 Fragen zu den Kommunikationsformen und eine Frage, die zur Reflexion über die eigene Kommunikation anregt. Füge ein Lückentext mit 5 Sätzen zum Thema Kommunikationsformen hinzu mit den zu ergänzenden Wörtern am Ende."
Alle Fragen und Lückentexte bei allen Sprachmodellen sind vollständig und richtig.
Die Angaben aus dem Prompt wurden richtig umgesetzt mit der Ausnahme von Gemini und Claude. Claude hat nur 3 Wörter für den Lückentext generiert und bei Gemini stehen die Einsetzwörter im Lückentext.
Alle Fragen können im Unterricht eingesetzt werden und sind eine echte Hilfestellung. Im Punkt Kreativität und Individualität gefällt mir, dass Gemini sich an den Taxonomien orientiert. Die Reflexionsfragen gefallen mir alle gut. Diese könnten individuell zur Anwendung kommen. Beim Lückentext überzeugt ChatGPT mit dem besten Inhalt.
Das Layout ist in allen Sprachmodellen, außer in Claude, schön strukturiert und kann als Kopie sehr schnell, ohne viel zu verändern als Arbeitsblatt eingesetzt werden, ein Bild noch in Copilot oder Canva generieren lassen und fertig ist das Arbeitsblatt.
Richtigkeit und Vollständigkeit der Antworten | Umsetzung des Prompts | Anwendbarkeit, Nutzen | Kreativität, Individualität | Layout | |
Perplexity | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
ChatGPT | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Gemini | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Copilot | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ | ⭐️⭐️⭐️⭐️ |
Claude | ⭐️⭐️⭐️ | ⭐️⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ | ⭐️⭐️ |
Bei dieser Aufgabenstellung können alle Sprachmodelle, bis auf Claude überzeugen und zeigen ihre Stärke bei der Erstellung von Texten. Hier kommt es, wie bei allen Aufgaben, auf den Prompt an. Je klarer der Prompt formuliert ist, je besser die Ergebnisse.
Um ein Arbeitsblatt zu erstellen, welches sich genau an deinen Inhalten orientiert, kannst du deine Materialien im Sprachmodell hochladen und dir dann die Aufgaben erstellen lassen.
Welches Sprachmodell ist denn jetzt das Beste für Menschen aus dem Bildungsbereich?
Werfen wir dazu noch einmal einen Blick auf die Auswertungen:
🎉 And the Winner is ... ChatGPT, gefolgt von Copilot und Perplexity.
Texte erstellen können also fast alle Sprachmodelle gleich gut. Ich habe Claude 3 getestet, weil ich auf Claude 3.5 keinen Zugriff habe. Wahrscheinlich sind mit der neueren Version die Ergebnisse besser. Ich werde das zu einem späteren Zeitpunkt nochmal testen. Außerdem wird ein weiterer Text folgen, mit der Erstellung von Fachtexten.
Bitte beachte, dass für diesen Vergleich keine tagesaktuellen Informationen notwendig waren. Daher konnten alle Sprachmodelle gute Arbeit machen. Sobald du Quellenangaben oder aktuelle Informationen brauchst, arbeite besser mit Perplexity oder Copilot, es sei denn du hast die Bezahlversion von ChatGPT.
Es gibt nicht das eine Sprachmodell. Die Entwicklung der Sprachmodelle schreitet sehr schnell voran. Daher wird immer mal das eine oder andere Modell besser sein. Wobei das auch abhängig ist, wofür du das Sprachmodell nutzt. Jedes Modell hat seine Stärken und auch noch Schwächen. Es ist wichtig diese zu kennen, um die Ergebnisse kritisch bewerten zu können. Manchmal ist es auch hilfreich zwei Modellen die gleiche Aufgabe zu stellen und sich dann das Beste aus beiden Modellen zu kopieren.
Wichtig ist es einfach mal anzufangen und die Modelle zu testen und Spaß bei der Anwendung zu bekommen und sich immer wieder von neuen Ergebnissen überraschen und inspirieren zu lassen.
Welches Modell ist dein Favorit und warum? Schreibe es gerne in die Kommentare.
☀️ Wenn du den ganzen Artikel mit den ausführlichen Ergebnissen möchtest, dann kannst du ihn hier runterladen.
Wenn du tiefer in die KI-Welt eintauchen möchtest, dann probiere doch mal einen Learn-Snack. Die Learn-Snacks sind schnelle Live-Online-Fortbildung für das ganze Team. Wähle einfach den passenden Snack aus und vereinbare einen Termin.
Noch keine Kommentare vorhanden
Was denkst du?