| 5 | 1/1 | 返回列表 |
| 查看: 288 | 回復(fù): 4 | ||
| 【懸賞金幣】回答本帖問(wèn)題,作者仙咸閑將贈(zèng)送您 5 個(gè)金幣 | ||
仙咸閑新蟲(chóng) (初入文壇)
|
[求助]
機(jī)器學(xué)習(xí) 催化 化工 已有2人參與
|
|
本人化工研一學(xué)生,研究方向是機(jī)器學(xué)習(xí)篩選催化劑,課題組也沒(méi)有人研究過(guò)這個(gè)方向。計(jì)算機(jī)零基礎(chǔ)小白看了文獻(xiàn)問(wèn)了AI還是不知道該從何下手,現(xiàn)在電腦已經(jīng)下載了anaconda,有沒(méi)有UU能交流一下,現(xiàn)在很痛苦迷茫啊 |
至尊木蟲(chóng) (文壇精英)
新蟲(chóng) (初入文壇)
銀蟲(chóng) (小有名氣)
|
第一步:先把環(huán)境跑通 你已經(jīng)裝了 Anaconda,這超級(jí)好!接下來(lái)做這幾件事(每步 5–10 分鐘): 打開(kāi) Anaconda Navigator(開(kāi)始菜單搜這個(gè)圖標(biāo)) 點(diǎn)開(kāi)后,左側(cè)選 Environments 點(diǎn) Create 新建一個(gè)環(huán)境,名字起個(gè)好記的,比如 ml_chem 或 catalyst_ml Python 選 3.10 或 3.11(推薦 3.10,兼容性最好) 在新環(huán)境里裝核心包(圖形界面最簡(jiǎn)單) 選剛剛建的環(huán)境 → 搜索框輸入下面這些包,一個(gè)個(gè)勾選安裝(改搜索范圍為 “All”): rdkit(必須,處理分子 SMILES、指紋) pandas(讀表格) numpy scikit-learn(機(jī)器學(xué)習(xí)基礎(chǔ)) xgboost(最好用的梯度提升模型) matplotlib(畫(huà)圖) seaborn(更好看的圖) jupyterlab(推薦,比老 Jupyter 好用) 點(diǎn) Apply 安裝(可能要等 5–15 分鐘) 裝完后回到 Home 標(biāo)簽,選你的新環(huán)境,點(diǎn) Launch JupyterLab 測(cè)試環(huán)境是否 OK(新建 notebook 跑下面代碼)新建一個(gè) notebook,粘貼運(yùn)行:Pythonfrom rdkit import Chem from rdkit.Chem import Draw mol = Chem.MolFromSmiles('c1ccccc1') # 苯環(huán) Draw.MolToImage(mol) # 如果彈出苯環(huán)結(jié)構(gòu)圖,就成功! import pandas as pd print(pd.__version__) # 看到版本號(hào)就 OK import xgboost print(xgboost.__version__) 如果苯環(huán)圖出來(lái)了 + 版本號(hào)正常 → 環(huán)境就通了!恭喜你已經(jīng)跨過(guò)最大門(mén)檻。 小建議(避免踩坑) 以后裝包優(yōu)先用 conda install -c conda-forge xxx(比 pip 穩(wěn)) 遇到權(quán)限問(wèn)題(WinError 5),以管理員打開(kāi) Anaconda Prompt 再裝 別在 base 環(huán)境里亂裝東西,始終用你新建的 ml_chem 環(huán)境 第二步:明確一個(gè)小目標(biāo)(別一下想篩所有催化劑) 你方向是篩催化劑,但范圍太廣容易迷失。先定一個(gè)小而具體的子問(wèn)題,比如: “我想預(yù)測(cè) Suzuki 偶聯(lián)里哪種膦配體產(chǎn)率高” “我想篩哪種金屬鹽在 CO2 還原里活性好” “我想看不同溶劑對(duì)某反應(yīng)轉(zhuǎn)化率的影響” 定好后,再去文獻(xiàn)里找對(duì)應(yīng)數(shù)據(jù)(后面我可以幫你推薦關(guān)鍵詞或數(shù)據(jù)集)。 第三步:數(shù)據(jù)從哪里來(lái)(最現(xiàn)實(shí)的起步) 先別自己做實(shí)驗(yàn)(太慢) 從論文 Supporting Information 里扒表格(最常見(jiàn)辦法) 推薦搜索:"high-throughput" OR "parallel synthesis" + 你關(guān)心的反應(yīng) + "supplementary excel" 或 "dataset" 目標(biāo):先搞到 100–300 條數(shù)據(jù)(催化劑/配體/底物 SMILES + 產(chǎn)率/TOF 等) 用 Excel 建一個(gè)主表,列名建議全英文 + 下劃線(xiàn)(方便后續(xù) pandas 讀)。核心列必須有,可選列根據(jù)你方向加。每填一個(gè) SMILES 就用 RDKit 測(cè)試一下能不能解析 建好 50–100 條后,就可以: 用 pandas 讀入 RDKit 生成催化劑/底物指紋 XGBoost / RF 做回歸(預(yù)測(cè) yield)或分類(lèi)(預(yù)測(cè) Top 催化劑) 評(píng)估 R² / Top-k acc |
至尊木蟲(chóng) (文壇精英)
| 5 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 調(diào)劑求院校招收 +5 | 鶴鯨鴿 2026-03-28 | 5/250 |
|
|---|---|---|---|---|
|
[碩博家園] 求調(diào)劑 有機(jī)化學(xué)考研356分 +3 | Nadiums 2026-03-25 | 4/200 |
|
|
[考研] 一志愿太原理工安全工程300分,求調(diào)劑 +5 | 0857求調(diào)劑. 2026-03-24 | 6/300 |
|
|
[考研] 求調(diào)劑一志愿海大,0703化學(xué)學(xué)碩304分,有大創(chuàng)項(xiàng)目,四級(jí)已過(guò) +7 | 幸運(yùn)哩哩 2026-03-22 | 11/550 |
|
|
[考研] 0856材料化工調(diào)劑 總分330 +11 | zhubinhao 2026-03-27 | 11/550 |
|
|
[考研] 0703化學(xué) +10 | 妮妮ninicgb 2026-03-27 | 10/500 |
|
|
[考研] 305求調(diào)劑 +5 | 哇盧卡庫(kù) 2026-03-26 | 5/250 |
|
|
[考研] 一志愿211,335分,0856,求調(diào)劑院校和導(dǎo)師 +4 | 傾____蕭 2026-03-27 | 5/250 |
|
|
[考研] 調(diào)劑推薦 +5 | 清酒714 2026-03-26 | 6/300 |
|
|
[考研] 材料求調(diào)劑 +5 | .m.. 2026-03-25 | 5/250 |
|
|
[論文投稿] Journal of Mechanical Science and Technology +3 | Russ_ss 2026-03-25 | 5/250 |
|
|
[考研] 求調(diào)劑,一志愿 南京航空航天大學(xué)大學(xué) ,080500材料科學(xué)與工程學(xué)碩 +4 | @taotao 2026-03-26 | 5/250 |
|
|
[考研] 求調(diào)劑 一志愿 本科 北科大 化學(xué) 343 +6 | 13831862839 2026-03-24 | 7/350 |
|
|
[考研] 調(diào)劑 +4 | 柚柚yoyo 2026-03-26 | 4/200 |
|
|
[考研] 求調(diào)劑 +8 | Auroracx 2026-03-22 | 8/400 |
|
|
[考研] 281求調(diào)劑 +3 | 亞克西good 2026-03-26 | 5/250 |
|
|
[考研] 334分 一志愿武理-080500 材料求調(diào)劑 +4 | 李李不服輸 2026-03-25 | 4/200 |
|
|
[考研] 材料調(diào)劑 +3 | iwinso 2026-03-23 | 3/150 |
|
|
[考研] 一志愿吉大化學(xué)322求調(diào)劑 +4 | 17501029541 2026-03-23 | 6/300 |
|
|
[考研] 336化工調(diào)劑 +4 | 王大坦1 2026-03-23 | 5/250 |
|