Deepseek yang menghairankan model AI yang murah mencabar gergasi industri. Syarikat itu mendakwa telah melatih rangkaian neural Deepseek V3 yang kuat untuk hanya $ 6 juta menggunakan hanya 2048 GPU, pesaing pemotongan yang ketara. Walau bagaimanapun, angka ini mengelirukan.
imej: ensigame.com
DeepSeek V3 memanfaatkan teknologi inovatif: Ramalan Multi-Token (MTP) Untuk ketepatan dan kecekapan yang dipertingkatkan; Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf, untuk mempercepat latihan dan meningkatkan prestasi; dan Perhatian Laten Multi-Head (MLA) Untuk memberi tumpuan kepada elemen kalimat penting, meminimumkan kehilangan maklumat.
imej: ensigame.com
Bertentangan dengan tuntutan awal mereka, semianalisis mendedahkan infrastruktur yang luas DeepSeek, yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper di pelbagai pusat data, yang mewakili jumlah pelaburan kira -kira $ 1.6 bilion dan kos operasi $ 944 juta. Ini termasuk pelaburan besar dalam kakitangan, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun.
imej: ensigame.com
DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memberikan kawalan yang lebih besar dan pelaksanaan inovasi yang lebih cepat. Pendekatan yang dibiayai sendiri ini menyumbang kepada ketangkasannya. Angka $ 6 juta hanya mencerminkan kos GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Pelaburan sebenar DeepSeek dalam pembangunan AI melebihi $ 500 juta.
imej: ensigame.com
Walaupun kejayaan DeepSeek berpunca dari pelaburan yang besar, kemajuan teknologi, dan pasukan mahir, naratif "mesra bajet" oversimplification. Walau bagaimanapun, walaupun dengan angka yang diperbetulkan, kos DeepSeek masih pucat berbanding pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta untuk melatih, sementara ChatGPT-4 berharga $ 100 juta. Walau bagaimanapun, kecekapan dan struktur fokus syarikat, membolehkannya bersaing dengan berkesan dengan gergasi industri, walaupun pelaburan besar terlibat.