AI-Frontiers - 博客园

2025年11月7日

Huggingface 214頁訓(xun)練手冊：揭(jie)露構建世界(jie)級大語言模型的(de)秘密

摘要：《The Smol Training Playbook: The Secrets to Building World-Class LLMs》由 Hugging Face 團隊于 2025 年 10 月 30 日發布，詳情見//huggingface.co/spaces/HuggingFa 閱讀全文

posted @ 2025-11-07 08:43 AI-Frontiers 閱讀(du)(251) 評論(0) 推薦(1)

2025年11月3日

收藏！強化學習從入門到封神：5 本經典(dian)教材 + 8 大實(shi)戰項目(mu) + 7個免費視頻，一站(zhan)式搞定

摘要：原文：//mp.weixin.qq.com/s/nfN0dWT3ZfDuW7ZGfaG6dA 學習資源經典教材《大模型算法：強化學習、微調與對齊》原創 100+ 架構圖，系統講解大模型、強化學習，涵蓋：LLM / VLM 等大模型原理、訓練算法（RL、RLHF、GRPO、DPO、S 閱讀全文

posted @ 2025-11-03 22:01 AI-Frontiers 閱讀(129) 評論(0) 推薦(jian)(0)

2025年10月30日

小(xiao)白也能看懂的RL-PPO

摘要：原文鏈接：//mp.weixin.qq.com/s/cx3qY42Lp0L3RaSOgsH77A 1. 強化學習基本概念強化學習（Reinforcement Learning, RL）作為機器學習的重要分支，目標是讓智能體（agent）與環境（environment）不斷交互，學習任意閱讀全文

posted @ 2025-10-30 22:20 AI-Frontiers 閱讀(8) 評論(lun)(0) 推薦(0)

中文字幕精品亚洲无线码二区,国产黄a三级三级三级看三级,亚洲七七久久桃花影院,丰满少妇被猛烈进入,国产小视频在线观看网站

AI-Frontiers 公#眾#號：AI-Frontiers

分享AI前沿進展、底層原理和行業應用

公告