Skip to content

Koperasi-KKGI/LLM-Building-Process

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

2 Commits
Β 
Β 

Repository files navigation

LLM-Building-Process

Learn to build - training - fine tuning- quantifying - AI LLM Models - Machine Learning

Membangun AI trained model dengan bahasa dan pengetahuan yang sangat spesifik dan untuk ditujukan/digunakan sebagai tools yang mempermudah para ahli di suatu bidang (misal : coder spesialis yang sudah spesifik berbasis platform tertentu)

Bagian 1: Pengantar Dunia AI dan LLM

1. Selamat Datang di Era Bahasa Buatan: Memahami Large Language Model (LLM)

  • Apa itu LLM dan bagaimana cara kerjanya?
  • Konsep "Text Completion" sebagai fondasi LLM.
  • Peran ChatML dalam interaksi LLM.
  • Mekanisme LLM berhenti menghasilkan output.

2. Membongkar Otak LLM: Arsitektur Transformer dan Pelatihan Generatif

  • Di balik kesederhanaan LLM: Kompleksitas arsitektur Transformer.
  • Proses pelatihan LLM: "Next Token Predictor".
  • Skala data pelatihan LLM: Triliunan token yang mengagumkan.

Bagian 2: Kustomisasi LLM: Fine-Tuning dan Efisiensi

3. Personalisasi LLM: Mengapa Fine-Tuning adalah Kunci

  • Definisi fine-tuning dan tujuannya.
  • Studi kasus penggunaan fine-tuning: Chatbot layanan pelanggan khusus.
  • Peran fine-tuning dalam menyesuaikan pengetahuan LLM.

4. Fine-Tuning yang Efisien: Memanfaatkan Lora (Low-Rank Adaptation)

  • Lora sebagai metode fine-tuning yang populer.
  • Prinsip kerja Lora: Modifikasi parsial untuk efisiensi.
  • Manfaat Lora: Mengurangi kebutuhan sumber daya komputasi.

5. Unsloth: Revolusi Fine-Tuning LLM yang Cepat dan Mudah

  • Keunggulan Unsloth: Kecepatan dan efisiensi memori GPU.
  • Kemudahan penggunaan Unsloth: Template dan integrasi Hugging Face.
  • Parameter kunci dalam fine-tuning dengan Unsloth: Max Sequence Length, Model Name, dan R Value.
  • Dukungan arsitektur model di Unsloth (Mistral, Llama, Gemma, dll.).

6. Memasukkan Data ke dalam LLM: Proses Dataset Loading dan Formatting

  • Pemuatan dataset dari Hugging Face.
  • Pentingnya format dataset yang sesuai (contoh: Alpaca Prompt).
  • Konsep "Epochs" dan "Steps" dalam proses fine-tuning.
  • Memahami "Overfit" dan bagaimana menghindarinya.

7. Dari Fine-Tuning ke Implementasi: Menggunakan Model LLM yang Dikustomisasi

  • Penyimpanan dan pengunggahan hasil fine-tuning.
  • Konsep "Quantization" dan format GGUF untuk efisiensi model.
  • Platform untuk menjalankan model GGUF (LM Studio, Ollama, Faraday, GPT for All).
  • Antarmuka pengguna untuk interaksi langsung dengan LLM.

Bagian 3: Membangun Mesin AI: PC Workstation untuk AI Training

8. Membangun Fondasi Kekuatan Komputasi: Perakitan PC Workstation Spesialis

  • Tujuan spesifik PC workstation ini: AI Training.
  • Casing InWin R400 Series 01n: Desain dan fitur untuk server/workstation.
  • Manajemen pendinginan casing: Fan depan dan belakang.
  • Dukungan penyimpanan dan GPU holder.
  • Kompatibilitas motherboard dan dukungan dual PSU.

9. Jantung Sistem: Power Supply, Storage, dan Pendinginan

  • NZXT C1500: Power supply 1500W dengan sertifikasi Platinum dan 12VHPWR.
  • Pentingnya jumlah kabel PCIE Express dan EPS untuk motherboard workstation.
  • Penyimpanan super cepat: 4x 4TB T-Force Cardea GE PRO Gen 5 NVMe SSD.
  • Solusi pendinginan prosesor: Arctic Freezer 4U (air cooling vs. liquid cooling).
  • Fan exhaust tambahan untuk sirkulasi udara optimal.

10. Otak dan Jaringan Syaraf: Prosesor, Memori, dan GPU Unggulan

  • AMD Ryzen Threadripper Pro 7965WX: Prosesor 24 core/48 thread untuk workstation.
  • Perbedaan dengan Threadripper biasa: Dukungan 8-channel memory.
  • ASUS Pro WS WRX90E-SAGE SE: Motherboard dengan chipset AMD WRX90, 8-channel memory, dan 7 PCIe Gen 5 slot.
  • Memori G.Skill Zeta R5 Neo DDR5 RDM 192GB.
  • GPU Ganda untuk AI Training: 2x NVIDIA RTX A6000 48GB.

11. Proses Perakitan (Hardware) dan Tantangan (Studi Kasus)

  • Langkah-langkah perakitan prosesor Threadripper ke socket TR5.
  • Pemasangan pendingin prosesor Arctic Freezer 4U.
  • Running test di luar casing dan kendala pemasangan power supply (pentingnya manual).
  • Waktu booting yang lama pada sistem memori besar dan indikator LED.
  • Pengujian performa (Cinebench R23, CPU Throttling Test, CrystalDiskMark) dan suhu komponen.
  • Hasil akhir dan biaya keseluruhan: Mesin AI Training seharga 500 juta Rupiah.

Youtube ref

About

Learn to build - training - fine tuning- quantifying - AI LLM Models - Machine Learning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors