🧠 Abschlussprojekt: Entwicklung eines eigenen Sprachmodells

Willkommen zum Abschlussprojekt dieses Kurses! In diesem Projekt setzt du dein Wissen über Sprachmodelle in die Praxis um und entwickelst dein eigenes autoregressives Modell auf Basis von PyTorch. Zusätzlich lernst du Tools wie Weights & Biases (wandb) und den Hugging Face Model Hub kennen – genau wie im echten ML-Workflow.

✅ Projektanforderungen

1. Modell

Erstelle ein Decoder-only Sprachmodell mit Modulen aus torch.nn.
Du darfst z. B. nn.TransformerDecoder, nn.TransformerDecoderLayer usw. verwenden.
Das Modell soll autoregressiv funktionieren (wie GPT).

2. Tokenizer

Verwende einen Tokenizer aus der Hugging Face transformers-Bibliothek.
Beispiel: AutoTokenizer oder GPT2Tokenizer.

3. Training

Trainiere dein Modell für mindestens 3 Epochen (5 empfohlen).
Nutze einen kleinen Datensatz wie Tiny Shakespeare, WikiText-2 oder einen eigenen.
Dein Modell sollte auch auf einer CPU trainierbar sein (< 1 Mio Parameter).
Schreibe den Trainingsloop komplett selbst in PyTorch (kein Trainer verwenden).

4. Evaluation

Berechne nach jeder Epoche den Loss auf einem Validierungsdatensatz.
Der Loss muss während des Trainings sichtbar sinken.

5. Logging

Verwende wandb, um Trainings- und Eval-Loss zu loggen.

6. Veröffentlichung

Lade dein Modell am Ende auf den Hugging Face Model Hub.
Füge eine kurze Model Card mit Beschreibung und Tags hinzu.

7. Abgabe

Forke dieses Repository.
Erstelle einen Branch mit deinem Namen, z. B. max-mustermann-final.
Füge deine .py-Datei oder dein Jupyter-Notebook sowie eine README.md hinzu.
Erstelle einen Pull Request bis spätestens 23:59 Uhr am 27.04.2025.

🌟 Bonus (optional)

Wenn du möchtest, kannst du zusätzlich ein vortrainiertes Modell wie GPT-2 mithilfe der Hugging Face transformers-Bibliothek finetunen:

Lade ein GPT-2-Modell und den passenden Tokenizer (GPT2Tokenizer) mit from_pretrained.
Trainiere es auf deinem Datensatz mit der Trainer API.
Logge mit wandb und lade auch dieses Modell auf Hugging Face hoch.

📝 Wichtige Hinweise

Logging mit wandb, das Hochladen auf den Hugging Face Hub und der Pull Request auf GitHub sind Pflicht.
Die Modellqualität ist nicht entscheidend, aber der Loss muss sinken.
Du wirst am Montag, den 28.04.2025 dein Projekt präsentieren und deinen Code erklären.

Viel Erfolg! 🚀

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧠 Abschlussprojekt: Entwicklung eines eigenen Sprachmodells

✅ Projektanforderungen

1. Modell

2. Tokenizer

3. Training

4. Evaluation

5. Logging

6. Veröffentlichung

7. Abgabe

🌟 Bonus (optional)

📝 Wichtige Hinweise

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

🧠 Abschlussprojekt: Entwicklung eines eigenen Sprachmodells

✅ Projektanforderungen

1. Modell

2. Tokenizer

3. Training

4. Evaluation

5. Logging

6. Veröffentlichung

7. Abgabe

🌟 Bonus (optional)

📝 Wichtige Hinweise

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Packages