<rt id="bn8ez"></rt>

<label id="bn8ez"></label>

<span id="bn8ez"></span>

<label id="bn8ez"><meter id="bn8ez"></meter></label>

<output id="nepkr"><ruby id="nepkr"></ruby></output>

<blockquote id="nepkr"><ruby id="nepkr"></ruby></blockquote>

<output id="nepkr"><ruby id="nepkr"></ruby></output>

<code id="nepkr"></code>

paulwong

2025年3月18日 #

強(qiáng)化學(xué)習(xí)資源

蘑菇書(shū)EasyRL
李宏毅老師的《深度強(qiáng)化學(xué)習(xí)》是強(qiáng)化學(xué)習(xí)領(lǐng)域經(jīng)典的中文視頻之一。李老師幽默風(fēng)趣的上課風(fēng)格讓晦澀難懂的強(qiáng)化學(xué)習(xí)理論變得輕松易懂，他會(huì)通過(guò)很多有趣的例子來(lái)講解強(qiáng)化學(xué)習(xí)理論。比如老師經(jīng)常會(huì)用玩 Atari 游戲的例子來(lái)講解強(qiáng)化學(xué)習(xí)算法。此外，為了教程的完整性，我們整理了周博磊老師的《強(qiáng)化學(xué)習(xí)綱要》、李科澆老師的《世界冠軍帶你從零實(shí)踐強(qiáng)化學(xué)習(xí)》以及多個(gè)強(qiáng)化學(xué)習(xí)的經(jīng)典資料作為補(bǔ)充。對(duì)于想入門(mén)強(qiáng)化學(xué)習(xí)又想看中文講解的人來(lái)說(shuō)絕對(duì)是非常推薦的。

本教程也稱(chēng)為“蘑菇書(shū)”，寓意是希望此書(shū)能夠?yàn)樽x者注入活力，讓讀者“吃”下這本蘑菇之后，能夠饒有興致地探索強(qiáng)化學(xué)習(xí)，像馬里奧那樣愈加強(qiáng)大，繼而在人工智能領(lǐng)域覓得意外的收獲。

https://github.com/datawhalechina/easy-rl?tab=readme-ov-file

posted @ 2025-04-30 14:15 paulwong 閱讀(15) | 評(píng)論 (0) | 編輯收藏

足球數(shù)據(jù)資源

足球基礎(chǔ)數(shù)據(jù)

https://www.nami.com/details/4nw10i0tela68lq#interface

足球統(tǒng)計(jì)數(shù)據(jù)

https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

足球統(tǒng)計(jì)數(shù)據(jù)

https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

足球高階數(shù)據(jù)

https://www.nami.com/details/g5wvvikteeixwzd#interface

指數(shù)數(shù)據(jù)

https://www.nami.com/details/o6w9kipt4yi78k3#interface

足球資料庫(kù)數(shù)據(jù)

https://www.nami.com/details/7j8gxi0to7inrql#interface

Marz火星數(shù)據(jù)（體育）

https://www.kancloud.cn/marz/marz-sport/3098904

posted @ 2025-04-24 14:56 paulwong 閱讀(48) | 評(píng)論 (0) | 編輯收藏

ai預(yù)測(cè)足球資源

基于機(jī)器學(xué)習(xí)的2022世界杯預(yù)測(cè)實(shí)戰(zhàn)

https://www.showmeai.tech/article-detail/400

AI 競(jìng)彩賽事預(yù)測(cè)工具

https://www.mysports.ai/cn

posted @ 2025-04-19 01:07 paulwong 閱讀(19) | 評(píng)論 (0) | 編輯收藏

微調(diào)訓(xùn)練的數(shù)據(jù)集

使用trl庫(kù)做微調(diào)時(shí), 對(duì)數(shù)據(jù)集的要求是:

如果是多輪對(duì)話(huà)場(chǎng)景:

jsonl 文件，且需符合以下要求:

1.每行是一個(gè)獨(dú)立的 JSON 對(duì)象;

2 每個(gè)對(duì)象須包含一個(gè)鍵名為 messages 的數(shù)組，數(shù)組不能為空;

3.messages 中每個(gè)元素必須包含 role 和 content 兩個(gè)字段:

4.role 只能是 system,user 或 assisiant;

5.如果有 system 角色消息, 需在數(shù)組首位;

6.第一條非 system 消息必須是 user 角色;

7.user 和 assisiant 角色的消息應(yīng)當(dāng)交替、成對(duì)出現(xiàn)，不少于1對(duì);

如果是指令微調(diào)場(chǎng)景:

jsonl 文件，且需符合以下要求:

1.每行是一個(gè)獨(dú)立的 JSON 對(duì)象;

2 每個(gè)對(duì)象須包含且只能包含一個(gè)鍵名為 text 的鍵值對(duì)，值不能為空;

posted @ 2025-03-21 21:52 paulwong 閱讀(63) | 評(píng)論 (0) | 編輯收藏

大模型訓(xùn)練的幾個(gè)階段

大模型開(kāi)發(fā)出來(lái)后, 一般要經(jīng)過(guò)以下幾個(gè)階段的訓(xùn)練:

預(yù)訓(xùn)練(Pre-Trained)

單純提供文本: {"text":"..."}

訓(xùn)練模型由第一個(gè)文字開(kāi)始, 預(yù)測(cè)后面的文字, 直到結(jié)束.

這種模型只會(huì)做完成文本的任務(wù)

監(jiān)督微調(diào)(Supervised Fine Turning)

為了使模型能完成根據(jù)指令完成回答, 而不是隨機(jī)生成回答

提供的文本: {"instruction":"...", "output":"..."}

高效參數(shù)微調(diào)(Parameter Efficient Fine Turning)

只調(diào)整部分參數(shù), 具體實(shí)現(xiàn)方法有LoRA

參考:

https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb

posted @ 2025-03-18 13:14 paulwong 閱讀(64) | 評(píng)論 (0) | 編輯收藏

主站蜘蛛池模板： www.亚洲色图| 国产国产人免费人成免费视频| 久久久久av无码免费网| 无人影院手机版在线观看免费| 日本免费电影一区| 精品亚洲视频在线观看 | 亚洲精品免费网站| 日韩高清在线免费观看| 亚洲一区二区三区在线播放 | 特级毛片aaaa免费观看| 亚洲久热无码av中文字幕| 亚洲国产AV无码一区二区三区| 亚洲大码熟女在线观看| 免费观看亚洲人成网站| 国产区在线免费观看| 嫩草影院在线播放www免费观看| 久久久久高潮毛片免费全部播放| h视频在线观看免费完整版| 成人免费视频77777| 日本免费一二区在线电影| 永久免费av无码网站大全| 成年性午夜免费视频网站不卡| 毛片免费观看视频| 国产免费av片在线播放| 亚洲综合另类小说色区色噜噜| 亚洲美女中文字幕| 亚洲国产精品一区二区三区在线观看| 亚洲av无码有乱码在线观看| jizz免费在线影视观看网站| 99热这里有免费国产精品| 国产三级在线观看免费| 亚洲日韩VA无码中文字幕| 亚洲国产老鸭窝一区二区三区| 亚洲一区二区三区在线 | 亚洲欧洲在线观看| 亚洲性无码AV中文字幕| 精品国产免费人成网站| 99在线精品免费视频九九视| 又粗又硬免费毛片| 亚洲伊人tv综合网色| 亚洲精品无码专区在线|

<button id="vapyt"></button><abbr id="vapyt"><style id="vapyt"></style></abbr>

<mark id="vapyt"></mark>