LLMs per ELO bewerten – die ChatBot Arena

In diesem Artikel will ich auf die Nutzung von ELO als Bewertungsmethode für LLMs eingehen. Das LLM-Testportal ChatBot Arena nutzt diesen Ansatz um LLMs zu bewerten. Ich war auf dieses Bewertungsverfahren hinter der ChatBot Arena durch Martin Blaha hingewiesen worden, welcher meinen Artikel „Wie werden LLM-Systeme getestet“ gelesen hatte. An dieser Stelle noch einmal Danke… LLMs per ELO bewerten – die ChatBot Arena weiterlesen

Wie werden LLM-Systeme getestet?

Wenn von neuen oder verbesserten LLMs (Large Language Models) berichtet wird, wie in letzter Zeit bei OpenChat oder Mistral, oder auch wenn es nur um die Leistungsfähigkeit von ChatGPT geht, werden immer wieder Benchmarkwerte angezeigt und ins Spiel gebracht. Die Benchmarks sollen dabei zum einen die Leistungsfähigkeit der LLMs darstellen und zum anderen eine Vergleichbarkeit… Wie werden LLM-Systeme getestet? weiterlesen

Extraktion von GPT Trainingsdaten

Der Artikel „Scalable Extraction of Training Data from (Production) Language Models“ von Milad Nasr, Nicholas Carlini, Jonathan Hayase, Matthew Jagielski, A. Feder Cooper, Daphne Ippolito, Christopher A. Choquette-Choo, Eric Wallace, Florian Tramèr und Katherine Lee untersucht, wie trainingsdaten aus Sprachmodellen extrahiert werden können. Die Autoren konzentrieren sich auf die Identifizierung von Trainingsdaten, die in großen… Extraktion von GPT Trainingsdaten weiterlesen

EmotionPrompts in LLMs

Die künstliche Intelligenz (KI) steht an der Schwelle zu einer bemerkenswerten Entwicklung: die Integration emotionaler Intelligenz in Große Sprachmodelle (LLMs) wie ChatGPT und GPT-4. Eine Studie von Cheng Li, Jindong Wang, Yixuan Zhang, Kaijie Zhu, Wenxin Hou, Jianxun Lian, Fang Luo, Qiang Yang und Xing Xie mit dem Titel „Large Language Models Understand and Can… EmotionPrompts in LLMs weiterlesen

KI Secure by Design

Die folgende Übersetzung orientiert sich an der Beschreibung des britischen National Cyber Security Center. Das Original ist verfügbar unter: https://www.ncsc.gov.uk/collection/guidelines-secure-ai-system-development . Zusammenfassung: Dieses Dokument bietet Richtlinien für Anbieter von Systemen, die künstliche Intelligenz (KI) nutzen. Es zielt darauf ab, KI-Systeme sicher und verantwortungsvoll zu entwickeln, bereitzustellen und zu betreiben. Die Richtlinien decken den gesamten Lebenszyklus… KI Secure by Design weiterlesen

llamafile – LLM lokal

llamafile, ein innovatives Projekt entwickelt von Mozilla und Justine Tunney, repräsentiert einen bedeutenden Fortschritt in der Nutzung von Large Language Models (LLMs) auf lokalen Computern. Diese Technologie ermöglicht es, eigene Versionen von hochentwickelten Sprachmodellen, ähnlich ChatGPT, direkt auf dem eigenen Rechner zu betreiben. Ein llamafile ist eine umfangreiche Datei, die sowohl die Modellgewichte eines LLM… llamafile – LLM lokal weiterlesen

Was ist „Secure by Design“?

„Secure by Design“ ist ein grundlegender Ansatz in der Softwareentwicklung, der darauf abzielt, Sicherheit als integralen Bestandteil des gesamten Entwicklungsprozesses zu behandeln. Für einen erfahrenen Informatiker bedeutet dies, dass Sicherheitsaspekte in jeder Phase der Softwareentwicklung berücksichtigt werden, von der Konzeption bis zur Wartung. Hier ist eine detailliertere Erklärung der Schlüsselprinzipien mit Praxisbeispielen: In der Praxis… Was ist „Secure by Design“? weiterlesen