MiniCPM V 4
Menjalankan AI multimodal yang bisa membaca gambar dan video biasanya butuh GPU cloud raksasa yang mahal. Tapi tidak dengan model yang satu ini! 🤖👁️⚡Halo semuanya, kembali lagi bersama saya Indra Rahmat. Di video kali ini, kita akan melakukan deep dive dan uji coba lokal terhadap MiniCPM-V 4.6, sebuah Multimodal LLM (MLLM) berukuran saku (pocket-sized) dari OpenBMB yang dirancang khusus untuk berjalan super efisien secara lokal.Meskipun ukurannya tergolong kecil (menggunakan basis Qwen3.5-0.8B), model ini dibekali teknologi kompresi visual mixed 4x/16x baru dari riset LLaVA-UHD v4. Hasilnya? Penghematan biaya komputasi visual hingga lebih dari 50% tanpa mengorbankan akurasi benchmark penting seperti OCRBench dan MathVista. Kita akan tes kemampuannya dalam mengekstrak teks, menganalisis objek, hingga memproses video secara langsung di komputer lokal! Dukung terus channel Indra Rahmat dengan cara Subscribe, klik Like, dan nyalakan lonceng notifikasinya. Sampaikan di kolom komentar, apa proyek AI lokal yang sedang kamu bangun saat ini!#IndraRahmat #MiniCPM #MultimodalAI #LocalLLM #Ollama #OpenBMB #ComputerVision #AIInfrastructure #TechIndonesia
Download
0 formatsNo download links available.