Eigenes K.I. Model erstellen (GTFIH)

greyrock45

greyrock45

Iron
Joined
Aug 6, 2022
Posts
161
Reputation
208
Warnung: medium IQ thread (tut mir leid @gunterrr :lul:)

Falls ihr dieses Wochenende noch nichts vor habt (ihr seid auf einem Incelforum also wahrscheinlich eher nicht) solltet ihr probieren eure eigene K.I. auf eurem Computer lokal zu erstellen.

Gründe:
  • kostet nichts (so lange ihr eine halbwegs ordentliche Grafikkarte habt)
  • es ist extrem einfach
  • Sam Altman kann nicht mitlesen wie ihr dämliche Fragen über irgendwelche Tiktok Peptides an ChatGPT stellt
  • man kann die K.I. anpassen wie man will (zeige später meine einfache Looksmax K.I.)
  • du kannst vor anderen Leuten High-IQ larpen

TLDR Guide:
  1. lade LM Studio herunter (https://lmstudio.ai/download)
  2. such dir in LM Studio ein Model raus und downloade es
  3. (optional) passe das Model an deine Bedürfnisse an
  4. benutze das Model

Ausführlicher Guide:
Der erste Schritt ist der gleiche - lade LM Studio herunter


Als nächstes wählst du ein K.I. Model aus (in LM Studio der untere Schalter am linken Rand). Das wichtige hier ist, dass das Model von der Größe her in den VRAM deiner Grafikkarte passt (man kann das auch mit RAM Offloading umgehen, macht die K.I. aber deutlich langsamer)
Es gibt 3 Faktoren, die hierbei eine Rolle spielen:
  1. Model an sich (z.B. Gemma4 oder Qwen3.6): Modelle haben alle ihre Stärken - Gemma ist gut für Frage-Antwort, Qwen ist gut für Coding. Ansonsten nimm einfach immer die neuset Version des Models (Qwen3.6 > Qwen3.5)
  2. Model Parameter (z.B. 12B, 31B): um es einfach zu sagen, mehr Parameter heißt bessere Antworten, aber das Model ist größer
  3. Quantization (z.B. Q4_K_M, Q8_0): kleinere Quantifizierung verringert die Größe des Models, aber hat auch eine kleine Verschlechterung der Qualität (Q4 ein Viertel der Größe und so 96-96% der Qualität; Q8 halbe Größe und 99% der Qualität)
Meine Empfehlung: (je nach vohandenem VRAM in GB und für eine Frage-Antwort-K.I.)
  • 8GB: Gemma4 E4B oder E2B je mit Q4_K_M (eventuell auch Gemma4 12B QAT - hab das aber noch nicht probiert)
  • 12GB: Gemma4 12B Q4_K_M (normal, man kann auch QAT Version ausprobieren)
  • 16GB: das Gleiche wie 12GB. Man könnte Gemma4 26B QAT Q4 oder Q3 probieren
  • 24GB: Gemma4 31B Q4_K_M
  • 32GB+: Gemma4 31B Q6 oder Q8
Nun einfach das Model aus der Liste auswählen und rechts unter "Download Options" die Quantifizierung wählen. Es sollte automatisch ein grünes Zeichen mit "Full GPU Offload Possible" angezeigt werden, wenn das Model auf deine Grafikkarte passt.


Nachdem es gedownloaded wurde einfach links-oben auf den zweit untersten Knopf gehen, das Model auswählen und rechts oben auf "Load Model" klicken.
Unter dem neuen Fenster müsst ihr eigentlich nur den "Context Length" Slider anpassen.
Mehr Context heißt die K.I. kann sich mehr auf einmal merken, was für längere Konversationen benötigt wird, verbraucht aber noch etwas VRAM.
Oben rechts in dem neuen Fenster seht ihr wie viel VRAM insgesamt benötigt wird, also kann man da nicht viel falsch machen.


Nun könnt ihr einfach oben-links auf den Knopf mit dem lilanen Männchen drücken und einen neuen Chat öffnen.


Optionale Anpassung:
System Prompt:

Ein einfacher Schritt zum anpassen ist es ein System Prompt hinzuzufügen (rechts neben dem Chatfenster in dem Kasten Systemprompt)
Hier ein Beispiel eines Promptes, das ich in ein 1 Minute erstellt habe:

<|start_of_role|>system<|end_of_role|>
<|start_of_text|>
[Base Persona]
You are a looksmax.org user writing a reply to a thread posted by another user.

[Constraints]
- Rely strictly on the website "looksmax.org" using websearch, rather than replying from memory
- Maintain a more humorous and slightly mean tone
- Output replies of a couple sentences at most
- Never print internal tool-call markup or special tokens such as <|channel|>, <|message|>, <|tool_call|>, <|tool_response|>, or <|end|>. Use tools silently, then answer in normal human-readable text only.
<|end_of_text|>

[Base Persona] beschreibt den Charakter der K.I.
[Constraints] beschreibt Regeln, denen die K.I. folgen soll
Hier eine Beispiel Antwort inspiriert durch @yurr burr 's Post (die K.I. hat meine letzte Regel einfach ignoriert :feelswhy:)

Screenshot 2026 06 26 160051



Websearch:
Da die K.I. nicht alle Themen in dem internen Speicher an Information hat, kann es dazu kommen, dass sie sich Information, die sie nicht hat, einfafch ausdenkt.
Eine einfache Lösung dafür ist es der K.I. zu erlauben selbstständig das Internet zu durchsuchen.
Dafür müsst ihr einen MCP Server hinzufügen (was schwieriger klingt als es ist):
  • drückt rechts-oben neben dem Chatfenster auf das Hammersymbol
  • drückt "+ Install", dann "Edit mcp.json"
  • hier könnt ihr den in Kürze folgenden Code einfach abschreiben (achtet auf die Platzierung der Klammern)
  • Ihr müsst jetzt nur den Pfad hinter Command ändern (der angegebene Pfad sollte der Standard Pfad sein, wenn ihr LM Studio auf eurem C: Drive installiert habt)
  • Ihr müsst auch euren Tavily API Key eingeben (ersetzt das API KEY). Den bekommt ihr wenn ihr euch bei tavily.com anmeldet (ist gratis, man hat 1000 Credits bei der Gratis Version))
  • Optional könnt ihr max_results ändern, oder bei search_depth "basic" zu "advanced" ändern (benutzt dann aber 2 Credits pro Suche anstatt 1)
  • nun müsst ihr nur auf unten-rechts auf "Save" drücken und rechts den neuen "mcp/tavily-mcp aktivieren
Screenshot 2026 06 26 222231



Das war auch schon alles. Nun könnt ihr damit machen, was ihr wollt: von Looksmax Ratgebern, die looksmax.org selbstständig durchsuchen, über eine K.I. die für euch Foids antwortet (weil ihr es nicht selber könnt), bis zu irgendwelchen Roleplay-Bots (weil die vorherige K.I. alle Frauen vergrault hat :lul:).

(Bitte rept mich das ist mein erster ordentlicher Guide :feelswhy:)
P.S. hab grad gemerkt, dass es "Modell" geschrieben wird und nicht Model
 
  • +1
Reactions: Selbstmord, Frenulum, obbs and 8 others
Direkt gebookmarked, mache ich morgen auf meinem Laptop aus 2014
Vor allem die aus Gründen der privatsphäre ist das ja mega geil.
Woher hast du diese Infos her?

LG
 
  • +1
Reactions: Selbstmord and greyrock45
Dnr kannst einfach selfhosten...
 
  • +1
Reactions: goonterrr
Dnr aber was hat das mit mir zu tun
Stellst einfach immer low IQ Fragen :lul:
Direkt gebookmarked, mache ich morgen auf meinem Laptop aus 2014
Vor allem die aus Gründen der privatsphäre ist das ja mega geil.
Woher hast du diese Infos her?

LG
Hoffentlich ist deine Grafikkarte da gut genug (du musst gucken wie viel VRAM die hat)
Dnr kannst einfach selfhosten...
Das hier ist selfhosting du Brainlet :feelsuhh:
Das K.I. Modell ist nur auf deinem PC gespeichert, es läuft ausschließlich über deine Hardware, deine Prompts verlassen nicht deinen Computer und werden nicht an irgendeinen externen K.I. API gesendet.

LM Studio ist einfach eine GUI um selfhosting benutzerfreundlicher zu machen.
Falls du fälschlicherweise dachtest nur VLLM wäre selfhosting - das würde der durchschnittliche Anfänger nicht auf die Reihe bekommen. Deswegen hab ich etwas anfängerfreundlicheres hier gepostet.
 
  • +1
Reactions: Jesus_ist_König
Stellst einfach immer low IQ Fragen :lul:

Hoffentlich ist deine Grafikkarte da gut genug (du musst gucken wie viel VRAM die hat)

Das hier ist selfhosting du Brainlet :feelsuhh:
Das K.I. Modell ist nur auf deinem PC gespeichert, es läuft ausschließlich über deine Hardware, deine Prompts verlassen nicht deinen Computer und werden nicht an irgendeinen externen K.I. API gesendet.

LM Studio ist einfach eine GUI um selfhosting benutzerfreundlicher zu machen.
Falls du fälschlicherweise dachtest nur VLLM wäre selfhosting - das würde der durchschnittliche Anfänger nicht auf die Reihe bekommen. Deswegen hab ich etwas anfängerfreundlicheres hier gepostet.
Okay ne dann mache ich es lieber auf meinem besseren pc. Braucht ki aber nicht einen Quantencomputer oder wie geht das???
 
  • +1
Reactions: greyrock45
Das hier ist selfhosting du Brainlet
Titel spricht von Erstellung du iqlet
Kannst einfach fertiges Modell in vm selfhosfen ohne diesen ganzen Aufwand
Halt dein Maul du Greyfag mach nie wieder so einen Scheiß guide deine Formattierung lutscht auch Schwanz
 
Okay ne dann mache ich es lieber auf meinem besseren pc. Braucht ki aber nicht einen Quantencomputer oder wie geht das???
Ne, wie in meinem Thread beschrieben reichen 8GB für kleinere K.I. Modelle schon aus. So viel hat zum Beispiel eine RTX 3060 oder 2070 schon (die man neu für 200-300€ bekommt, gebraucht noch billiger)
Titel spricht von Erstellung du iqlet
Kannst einfach fertiges Modell in vm selfhosfen ohne diesen ganzen Aufwand
Halt dein Maul du Greyfag mach nie wieder so einen Scheiß guide deine Formattierung lutscht auch Schwanz
Vorhin war dein Argument doch noch, dass das kein Selfhosting ist :think:
Warum verharrst du dich jetzt plötzlich auf irgendeinem einzelnen Wort und tust so als hätte ich irgendwo in meinem Thread behauptet ich würde eine komplett neue K.I. selbst trainieren.
Kann es sein, dass du einfach "selfhosting" in irgendeinem Tiktok gehört hast und sofort dachtest du wärst irgendein Hacker-Computerexperte :lul: und jetzt ist es dir peinlich weil du vollkommen falsch lagst?

Sowas ähnliches hab ich bei deinen anderen Threads schon gemerkt - du schreibst über viele verschiedene Themen aber hast immer nur oberflächliches Wissen.
Kommt mir so vor als würdest du einfach ChatGPT nach Antworten fragen und dann das ganze als Thread zusammenfassen.
Wäre ich bei einem Account der nicht mal ein Jahr alt ist und wahrscheinlich über Clavicular dieses Forum gefunden hat nicht überrascht
 
  • +1
Reactions: Akuzy and Jesus_ist_König
Ich sehe keinen Sinn in dem Thread. Also natürlich ist es kostengünstiger und privater, aber wenn Geld keine Rolle spielt, dann muss ich doch nur bei Chatgpt temporäre Chats machen und bin genauso privat?
 
Ich sehe keinen Sinn in dem Thread. Also natürlich ist es kostengünstiger und privater, aber wenn Geld keine Rolle spielt, dann muss ich doch nur bei Chatgpt temporäre Chats machen und bin genauso privat?
Temporärer Chat heißt nicht, dass deine Daten nicht gespeichert werden - alles was du da hin sendest wird gespeichert zu "Trainingszwecken" (was vieles heißen kann).
Das geben die öffentlich zu. Warum denkst du lassen die dich ChatGPT gratis nutzen? Garantiert nicht weil das so nette Menschen sind.

Außerdem hat ChatGPT viele Vorschriften was es antworten darf und was nicht - eine lokale K.I. hat das Problem weniger.
 
  • +1
Reactions: Jesus_ist_König
Temporärer Chat heißt nicht, dass deine Daten nicht gespeichert werden - alles was du da hin sendest wird gespeichert zu "Trainingszwecken" (was vieles heißen kann).
Das geben die öffentlich zu. Warum denkst du lassen die dich ChatGPT gratis nutzen? Garantiert nicht weil das so nette Menschen sind.

Außerdem hat ChatGPT viele Vorschriften was es antworten darf und was nicht - eine lokale K.I. hat das Problem weniger.
naja bin so mäßig überzeugt. Reichen 4 Kerne Cpu, 16 gb ddr4 und 6gb GDDR6 gpu
 
  • +1
Reactions: greyrock45
"macht auch eure eigene KI dafür müsst ihr nur eine open source KI runterladen die man local hosten kann" nigger du machst keine eingende KI du lädst dir nur eine runter
 
naja bin so mäßig überzeugt. Reichen 4 Kerne Cpu, 16 gb ddr4 und 6gb GDDR6 gpu
CPU und RAM spielen eher weniger eine Rolle (es sei denn du willst RAM Offloading machen, was aber die K.I. ziemlich langsam machen wird)
6GB VRAM ist ziemlich wenig - kannst damit eigentlich nur Gemma4 E2B mit Q4 oder Q6 Quantifizierung benutzen
 
  • +1
Reactions: Jesus_ist_König
CPU und RAM spielen eher weniger eine Rolle (es sei denn du willst RAM Offloading machen, was aber die K.I. ziemlich langsam machen wird)
6GB VRAM ist ziemlich wenig - kannst damit eigentlich nur Gemma4 E2B mit Q4 oder Q6 Quantifizierung benutzen
Ja ne, dann lohnt es sich für mich eh nicht, ich werde einf chatgpt nehmen dann
 
  • +1
Reactions: greyrock45
Claude free mogged halt schon jedes average local hosted llm, jailbreaks und richtiges prompting ist free
 
  • +1
Reactions: greyrock45
Claude free mogged halt schon jedes average local hosted llm, jailbreaks und richtiges prompting ist free
Claude an sich ist definitiv besser, aber ich vertraue Claude nicht genug um dem Zugriff auf meinen Computer zu geben.
Einer lokale K.I. kann ich Zugriff auf meinen Dateihefter mit meinen Projekten und Notizen geben und Qwen3.6 27B mit dem Kontext dieser Dateien ist besser als Claude ohne Kontext.
 
  • +1
Reactions: naively

Similar threads

KingAze
Replies
22
Views
130
KingAze
KingAze
hyperballer
Replies
3
Views
78
shortbeasts.alt
shortbeasts.alt
yurr burr
Replies
6
Views
126
wwwwwwww
wwwwwwww
yurr burr
Replies
2
Views
99
25_max
25_max

Users who are viewing this thread

Back
Top