👨💻 關於我
📚 部落格
🧠 企業顧問
🎓 Hugo課程
🤖 AI前沿
💻 程式語言
🐍 Python教學
文章列表
🌐 系統架構
💼 商業技術
標籤
🎬 影片筆記
文章搜索
Multimodal
GEMS:通用多模態感測框架
SGLang Omni:使用 SGLang 進行多模態 LLM 推論
MiniCPM-o:開源多模態 LLM,支援視覺、語音和文字
OmniSVG:統一多模態 SVG 生成模型(NeurIPS 2025)
VILA:NVIDIA NVlabs 的開源視覺語言模型家族
訂閱我們的電子報
×
掌握最新趨勢和獨家內容,直接發送到您的收件匣!
訂閱