Eigenes K.I. Model erstellen (GTFIH)

greyrock45 · Friday at 3:35 PM

Warnung: medium IQ thread (tut mir leid @gunterrr

)

Falls ihr dieses Wochenende noch nichts vor habt (ihr seid auf einem Incelforum also wahrscheinlich eher nicht) solltet ihr probieren eure eigene K.I. auf eurem Computer lokal zu erstellen.

Gründe:

kostet nichts (so lange ihr eine halbwegs ordentliche Grafikkarte habt)
es ist extrem einfach
Sam Altman kann nicht mitlesen wie ihr dämliche Fragen über irgendwelche Tiktok Peptides an ChatGPT stellt
man kann die K.I. anpassen wie man will (zeige später meine einfache Looksmax K.I.)
du kannst vor anderen Leuten High-IQ larpen

TLDR Guide:

lade LM Studio herunter (https://lmstudio.ai/download)
such dir in LM Studio ein Model raus und downloade es
(optional) passe das Model an deine Bedürfnisse an
benutze das Model

Ausführlicher Guide:
Der erste Schritt ist der gleiche - lade LM Studio herunter

Als nächstes wählst du ein K.I. Model aus (in LM Studio der untere Schalter am linken Rand). Das wichtige hier ist, dass das Model von der Größe her in den VRAM deiner Grafikkarte passt (man kann das auch mit RAM Offloading umgehen, macht die K.I. aber deutlich langsamer)
Es gibt 3 Faktoren, die hierbei eine Rolle spielen:

Model an sich (z.B. Gemma4 oder Qwen3.6): Modelle haben alle ihre Stärken - Gemma ist gut für Frage-Antwort, Qwen ist gut für Coding. Ansonsten nimm einfach immer die neuset Version des Models (Qwen3.6 > Qwen3.5)
Model Parameter (z.B. 12B, 31B): um es einfach zu sagen, mehr Parameter heißt bessere Antworten, aber das Model ist größer
Quantization (z.B. Q4_K_M, Q8_0): kleinere Quantifizierung verringert die Größe des Models, aber hat auch eine kleine Verschlechterung der Qualität (Q4 ein Viertel der Größe und so 96-96% der Qualität; Q8 halbe Größe und 99% der Qualität)

Meine Empfehlung: (je nach vohandenem VRAM in GB und für eine Frage-Antwort-K.I.)

8GB: Gemma4 E4B oder E2B je mit Q4_K_M (eventuell auch Gemma4 12B QAT - hab das aber noch nicht probiert)
12GB: Gemma4 12B Q4_K_M (normal, man kann auch QAT Version ausprobieren)
16GB: das Gleiche wie 12GB. Man könnte Gemma4 26B QAT Q4 oder Q3 probieren
24GB: Gemma4 31B Q4_K_M
32GB+: Gemma4 31B Q6 oder Q8

Nun einfach das Model aus der Liste auswählen und rechts unter "Download Options" die Quantifizierung wählen. Es sollte automatisch ein grünes Zeichen mit "Full GPU Offload Possible" angezeigt werden, wenn das Model auf deine Grafikkarte passt.

Nachdem es gedownloaded wurde einfach links-oben auf den zweit untersten Knopf gehen, das Model auswählen und rechts oben auf "Load Model" klicken.
Unter dem neuen Fenster müsst ihr eigentlich nur den "Context Length" Slider anpassen.
Mehr Context heißt die K.I. kann sich mehr auf einmal merken, was für längere Konversationen benötigt wird, verbraucht aber noch etwas VRAM.
Oben rechts in dem neuen Fenster seht ihr wie viel VRAM insgesamt benötigt wird, also kann man da nicht viel falsch machen.

Nun könnt ihr einfach oben-links auf den Knopf mit dem lilanen Männchen drücken und einen neuen Chat öffnen.

Optionale Anpassung:
System Prompt:
Ein einfacher Schritt zum anpassen ist es ein System Prompt hinzuzufügen (rechts neben dem Chatfenster in dem Kasten Systemprompt)
Hier ein Beispiel eines Promptes, das ich in ein 1 Minute erstellt habe:

<|start_of_role|>system<|end_of_role|>
<|start_of_text|>
[Base Persona]
You are a looksmax.org user writing a reply to a thread posted by another user.

[Constraints]
- Rely strictly on the website "looksmax.org" using websearch, rather than replying from memory
- Maintain a more humorous and slightly mean tone
- Output replies of a couple sentences at most
- Never print internal tool-call markup or special tokens such as <|channel|>, <|message|>, <|tool_call|>, <|tool_response|>, or <|end|>. Use tools silently, then answer in normal human-readable text only.
<|end_of_text|>

[Base Persona] beschreibt den Charakter der K.I.
[Constraints] beschreibt Regeln, denen die K.I. folgen soll
Hier eine Beispiel Antwort inspiriert durch @yurr burr 's Post (die K.I. hat meine letzte Regel einfach ignoriert

)

Websearch:
Da die K.I. nicht alle Themen in dem internen Speicher an Information hat, kann es dazu kommen, dass sie sich Information, die sie nicht hat, einfafch ausdenkt.
Eine einfache Lösung dafür ist es der K.I. zu erlauben selbstständig das Internet zu durchsuchen.
Dafür müsst ihr einen MCP Server hinzufügen (was schwieriger klingt als es ist):

drückt rechts-oben neben dem Chatfenster auf das Hammersymbol
drückt "+ Install", dann "Edit mcp.json"
hier könnt ihr den in Kürze folgenden Code einfach abschreiben (achtet auf die Platzierung der Klammern)
Ihr müsst jetzt nur den Pfad hinter Command ändern (der angegebene Pfad sollte der Standard Pfad sein, wenn ihr LM Studio auf eurem C: Drive installiert habt)
Ihr müsst auch euren Tavily API Key eingeben (ersetzt das API KEY). Den bekommt ihr wenn ihr euch bei tavily.com anmeldet (ist gratis, man hat 1000 Credits bei der Gratis Version))
Optional könnt ihr max_results ändern, oder bei search_depth "basic" zu "advanced" ändern (benutzt dann aber 2 Credits pro Suche anstatt 1)
nun müsst ihr nur auf unten-rechts auf "Save" drücken und rechts den neuen "mcp/tavily-mcp aktivieren

Das war auch schon alles. Nun könnt ihr damit machen, was ihr wollt: von Looksmax Ratgebern, die looksmax.org selbstständig durchsuchen, über eine K.I. die für euch Foids antwortet (weil ihr es nicht selber könnt), bis zu irgendwelchen Roleplay-Bots (weil die vorherige K.I. alle Frauen vergrault hat

).

(Bitte rept mich das ist mein erster ordentlicher Guide

)
P.S. hab grad gemerkt, dass es "Modell" geschrieben wird und nicht Model

gunterrr · Friday at 4:47 PM

greyrock45 said:
Warnung: medium IQ thread (tut mir leid @gunterrr )

Dnr aber was hat das mit mir zu tun

Jesus_ist_König · Friday at 4:50 PM

Direkt gebookmarked, mache ich morgen auf meinem Laptop aus 2014
Vor allem die aus Gründen der privatsphäre ist das ja mega geil.
Woher hast du diese Infos her?

LG

Niebvll · Friday at 5:30 PM

Dnr kannst einfach selfhosten...

greyrock45 · Saturday at 3:35 AM

gunterrr said:
Dnr aber was hat das mit mir zu tun

Stellst einfach immer low IQ Fragen

Jesus_ist_König said:
Direkt gebookmarked, mache ich morgen auf meinem Laptop aus 2014
Vor allem die aus Gründen der privatsphäre ist das ja mega geil.
Woher hast du diese Infos her?

LG

Hoffentlich ist deine Grafikkarte da gut genug (du musst gucken wie viel VRAM die hat)

Niebvll said:
Dnr kannst einfach selfhosten...

Das hier ist selfhosting du Brainlet

Das K.I. Modell ist nur auf deinem PC gespeichert, es läuft ausschließlich über deine Hardware, deine Prompts verlassen nicht deinen Computer und werden nicht an irgendeinen externen K.I. API gesendet.

LM Studio ist einfach eine GUI um selfhosting benutzerfreundlicher zu machen.
Falls du fälschlicherweise dachtest nur VLLM wäre selfhosting - das würde der durchschnittliche Anfänger nicht auf die Reihe bekommen. Deswegen hab ich etwas anfängerfreundlicheres hier gepostet.

Jesus_ist_König · Saturday at 3:44 AM

greyrock45 said:
Stellst einfach immer low IQ Fragen

Hoffentlich ist deine Grafikkarte da gut genug (du musst gucken wie viel VRAM die hat)

Das hier ist selfhosting du Brainlet
Das K.I. Modell ist nur auf deinem PC gespeichert, es läuft ausschließlich über deine Hardware, deine Prompts verlassen nicht deinen Computer und werden nicht an irgendeinen externen K.I. API gesendet.

LM Studio ist einfach eine GUI um selfhosting benutzerfreundlicher zu machen.
Falls du fälschlicherweise dachtest nur VLLM wäre selfhosting - das würde der durchschnittliche Anfänger nicht auf die Reihe bekommen. Deswegen hab ich etwas anfängerfreundlicheres hier gepostet.

Okay ne dann mache ich es lieber auf meinem besseren pc. Braucht ki aber nicht einen Quantencomputer oder wie geht das???

Niebvll · Saturday at 3:50 AM

greyrock45 said:
Das hier ist selfhosting du Brainlet

Titel spricht von Erstellung du iqlet
Kannst einfach fertiges Modell in vm selfhosfen ohne diesen ganzen Aufwand
Halt dein Maul du Greyfag mach nie wieder so einen Scheiß guide deine Formattierung lutscht auch Schwanz

greyrock45 · Saturday at 4:04 AM

Jesus_ist_König said:
Okay ne dann mache ich es lieber auf meinem besseren pc. Braucht ki aber nicht einen Quantencomputer oder wie geht das???

Ne, wie in meinem Thread beschrieben reichen 8GB für kleinere K.I. Modelle schon aus. So viel hat zum Beispiel eine RTX 3060 oder 2070 schon (die man neu für 200-300€ bekommt, gebraucht noch billiger)

Niebvll said:
Titel spricht von Erstellung du iqlet
Kannst einfach fertiges Modell in vm selfhosfen ohne diesen ganzen Aufwand
Halt dein Maul du Greyfag mach nie wieder so einen Scheiß guide deine Formattierung lutscht auch Schwanz

Vorhin war dein Argument doch noch, dass das kein Selfhosting ist

Warum verharrst du dich jetzt plötzlich auf irgendeinem einzelnen Wort und tust so als hätte ich irgendwo in meinem Thread behauptet ich würde eine komplett neue K.I. selbst trainieren.
Kann es sein, dass du einfach "selfhosting" in irgendeinem Tiktok gehört hast und sofort dachtest du wärst irgendein Hacker-Computerexperte

und jetzt ist es dir peinlich weil du vollkommen falsch lagst?

Sowas ähnliches hab ich bei deinen anderen Threads schon gemerkt - du schreibst über viele verschiedene Themen aber hast immer nur oberflächliches Wissen.
Kommt mir so vor als würdest du einfach ChatGPT nach Antworten fragen und dann das ganze als Thread zusammenfassen.
Wäre ich bei einem Account der nicht mal ein Jahr alt ist und wahrscheinlich über Clavicular dieses Forum gefunden hat nicht überrascht

Jesus_ist_König · Monday at 5:44 AM

Ich sehe keinen Sinn in dem Thread. Also natürlich ist es kostengünstiger und privater, aber wenn Geld keine Rolle spielt, dann muss ich doch nur bei Chatgpt temporäre Chats machen und bin genauso privat?

greyrock45 · Monday at 6:24 AM

Jesus_ist_König said:
Ich sehe keinen Sinn in dem Thread. Also natürlich ist es kostengünstiger und privater, aber wenn Geld keine Rolle spielt, dann muss ich doch nur bei Chatgpt temporäre Chats machen und bin genauso privat?

Temporärer Chat heißt nicht, dass deine Daten nicht gespeichert werden - alles was du da hin sendest wird gespeichert zu "Trainingszwecken" (was vieles heißen kann).
Das geben die öffentlich zu. Warum denkst du lassen die dich ChatGPT gratis nutzen? Garantiert nicht weil das so nette Menschen sind.

Außerdem hat ChatGPT viele Vorschriften was es antworten darf und was nicht - eine lokale K.I. hat das Problem weniger.

Jesus_ist_König · Monday at 6:36 AM

greyrock45 said:
Temporärer Chat heißt nicht, dass deine Daten nicht gespeichert werden - alles was du da hin sendest wird gespeichert zu "Trainingszwecken" (was vieles heißen kann).
Das geben die öffentlich zu. Warum denkst du lassen die dich ChatGPT gratis nutzen? Garantiert nicht weil das so nette Menschen sind.

Außerdem hat ChatGPT viele Vorschriften was es antworten darf und was nicht - eine lokale K.I. hat das Problem weniger.

naja bin so mäßig überzeugt. Reichen 4 Kerne Cpu, 16 gb ddr4 und 6gb GDDR6 gpu

spezisigma · Monday at 6:43 AM

"macht auch eure eigene KI dafür müsst ihr nur eine open source KI runterladen die man local hosten kann" nigger du machst keine eingende KI du lädst dir nur eine runter

greyrock45 · Monday at 7:19 AM

Jesus_ist_König said:
naja bin so mäßig überzeugt. Reichen 4 Kerne Cpu, 16 gb ddr4 und 6gb GDDR6 gpu

CPU und RAM spielen eher weniger eine Rolle (es sei denn du willst RAM Offloading machen, was aber die K.I. ziemlich langsam machen wird)
6GB VRAM ist ziemlich wenig - kannst damit eigentlich nur Gemma4 E2B mit Q4 oder Q6 Quantifizierung benutzen

Jesus_ist_König · Monday at 8:33 AM

greyrock45 said:
CPU und RAM spielen eher weniger eine Rolle (es sei denn du willst RAM Offloading machen, was aber die K.I. ziemlich langsam machen wird)
6GB VRAM ist ziemlich wenig - kannst damit eigentlich nur Gemma4 E2B mit Q4 oder Q6 Quantifizierung benutzen

Ja ne, dann lohnt es sich für mich eh nicht, ich werde einf chatgpt nehmen dann

naively · Monday at 8:46 AM

Claude free mogged halt schon jedes average local hosted llm, jailbreaks und richtiges prompting ist free

greyrock45 · Monday at 9:18 AM

httVxtor said:
Claude free mogged halt schon jedes average local hosted llm, jailbreaks und richtiges prompting ist free

Claude an sich ist definitiv besser, aber ich vertraue Claude nicht genug um dem Zugriff auf meinen Computer zu geben.
Einer lokale K.I. kann ich Zugriff auf meinen Dateihefter mit meinen Projekten und Notizen geben und Qwen3.6 27B mit dem Kontext dieser Dateien ist besser als Claude ohne Kontext.

Eigenes K.I. Model erstellen (GTFIH)

greyrock45

Iron

gunterrr

Mistral

Jesus_ist_König

I am thinking about becoming asexual

Niebvll

Erster .org-Subforum Nutzer in Gottes Gnade

greyrock45

Iron

Jesus_ist_König

I am thinking about becoming asexual

Niebvll

Erster .org-Subforum Nutzer in Gottes Gnade

greyrock45

Iron

Jesus_ist_König

I am thinking about becoming asexual

greyrock45

Iron

Jesus_ist_König

I am thinking about becoming asexual

spezisigma

143 iq

greyrock45

Iron

Jesus_ist_König

I am thinking about becoming asexual

naively

in need of epistemic certainty

greyrock45

Iron

Similar threads

Users who are viewing this thread