| 5 | 1/1 | 返回列表 |
| 查看: 286 | 回復(fù): 4 | ||
| 【懸賞金幣】回答本帖問題,作者仙咸閑將贈送您 5 個金幣 | ||
仙咸閑新蟲 (初入文壇)
|
[求助]
機(jī)器學(xué)習(xí) 催化 化工 已有2人參與
|
|
本人化工研一學(xué)生,研究方向是機(jī)器學(xué)習(xí)篩選催化劑,課題組也沒有人研究過這個方向。計算機(jī)零基礎(chǔ)小白看了文獻(xiàn)問了AI還是不知道該從何下手,現(xiàn)在電腦已經(jīng)下載了anaconda,有沒有UU能交流一下,現(xiàn)在很痛苦迷茫啊 |
至尊木蟲 (文壇精英)
新蟲 (初入文壇)
銀蟲 (小有名氣)
|
第一步:先把環(huán)境跑通 你已經(jīng)裝了 Anaconda,這超級好!接下來做這幾件事(每步 5–10 分鐘): 打開 Anaconda Navigator(開始菜單搜這個圖標(biāo)) 點開后,左側(cè)選 Environments 點 Create 新建一個環(huán)境,名字起個好記的,比如 ml_chem 或 catalyst_ml Python 選 3.10 或 3.11(推薦 3.10,兼容性最好) 在新環(huán)境里裝核心包(圖形界面最簡單) 選剛剛建的環(huán)境 → 搜索框輸入下面這些包,一個個勾選安裝(改搜索范圍為 “All”): rdkit(必須,處理分子 SMILES、指紋) pandas(讀表格) numpy scikit-learn(機(jī)器學(xué)習(xí)基礎(chǔ)) xgboost(最好用的梯度提升模型) matplotlib(畫圖) seaborn(更好看的圖) jupyterlab(推薦,比老 Jupyter 好用) 點 Apply 安裝(可能要等 5–15 分鐘) 裝完后回到 Home 標(biāo)簽,選你的新環(huán)境,點 Launch JupyterLab 測試環(huán)境是否 OK(新建 notebook 跑下面代碼)新建一個 notebook,粘貼運行:Pythonfrom rdkit import Chem from rdkit.Chem import Draw mol = Chem.MolFromSmiles('c1ccccc1') # 苯環(huán) Draw.MolToImage(mol) # 如果彈出苯環(huán)結(jié)構(gòu)圖,就成功! import pandas as pd print(pd.__version__) # 看到版本號就 OK import xgboost print(xgboost.__version__) 如果苯環(huán)圖出來了 + 版本號正常 → 環(huán)境就通了!恭喜你已經(jīng)跨過最大門檻。 小建議(避免踩坑) 以后裝包優(yōu)先用 conda install -c conda-forge xxx(比 pip 穩(wěn)) 遇到權(quán)限問題(WinError 5),以管理員打開 Anaconda Prompt 再裝 別在 base 環(huán)境里亂裝東西,始終用你新建的 ml_chem 環(huán)境 第二步:明確一個小目標(biāo)(別一下想篩所有催化劑) 你方向是篩催化劑,但范圍太廣容易迷失。先定一個小而具體的子問題,比如: “我想預(yù)測 Suzuki 偶聯(lián)里哪種膦配體產(chǎn)率高” “我想篩哪種金屬鹽在 CO2 還原里活性好” “我想看不同溶劑對某反應(yīng)轉(zhuǎn)化率的影響” 定好后,再去文獻(xiàn)里找對應(yīng)數(shù)據(jù)(后面我可以幫你推薦關(guān)鍵詞或數(shù)據(jù)集)。 第三步:數(shù)據(jù)從哪里來(最現(xiàn)實的起步) 先別自己做實驗(太慢) 從論文 Supporting Information 里扒表格(最常見辦法) 推薦搜索:"high-throughput" OR "parallel synthesis" + 你關(guān)心的反應(yīng) + "supplementary excel" 或 "dataset" 目標(biāo):先搞到 100–300 條數(shù)據(jù)(催化劑/配體/底物 SMILES + 產(chǎn)率/TOF 等) 用 Excel 建一個主表,列名建議全英文 + 下劃線(方便后續(xù) pandas 讀)。核心列必須有,可選列根據(jù)你方向加。每填一個 SMILES 就用 RDKit 測試一下能不能解析 建好 50–100 條后,就可以: 用 pandas 讀入 RDKit 生成催化劑/底物指紋 XGBoost / RF 做回歸(預(yù)測 yield)或分類(預(yù)測 Top 催化劑) 評估 R² / Top-k acc |
至尊木蟲 (文壇精英)
| 5 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 085600 材料與化工 329分求調(diào)劑 +10 | Mr. Z 2026-03-25 | 10/500 |
|
|---|---|---|---|---|
|
[考研] 070300化學(xué)354求調(diào)劑 +3 | 101次希望 2026-03-28 | 3/150 |
|
|
[考研] 295求調(diào)劑 +4 | wei-5 2026-03-26 | 4/200 |
|
|
[考研] 085701求調(diào)劑初試286分 +4 | secret0328 2026-03-28 | 4/200 |
|
|
[考研] 283求調(diào)劑 +3 | A child 2026-03-28 | 3/150 |
|
|
[考研] 085600,材料與化工321分求調(diào)劑 +9 | 大饞小子 2026-03-28 | 9/450 |
|
|
[考研] 329求調(diào)劑 +6 | 星野? 2026-03-26 | 6/300 |
|
|
[考研] 0703化學(xué)求調(diào)劑 +9 | 奶油草莓. 2026-03-22 | 10/500 |
|
|
[考研] 317求調(diào)劑 +6 | 十閑wx 2026-03-24 | 6/300 |
|
|
[考研] 277跪求調(diào)劑 +5 | 1915668 2026-03-27 | 9/450 |
|
|
[考研] 331環(huán)境科學(xué)與工程求調(diào)劑 +3 | 熠然好運氣 2026-03-27 | 3/150 |
|
|
[考研] 求調(diào)劑 +8 | Auroracx 2026-03-22 | 8/400 |
|
|
[考研] 一志愿南航 335分 | 0856材料化工 | GPA 4.07 | 有科研經(jīng)歷 +6 | cccchenso 2026-03-23 | 6/300 |
|
|
[考研] 機(jī)械學(xué)碩總分317求調(diào)劑。。! +4 | Acaciad 2026-03-25 | 4/200 |
|
|
[考研] 0854AI CV方向招收調(diào)劑 +4 | 章小魚567 2026-03-23 | 4/200 |
|
|
[考研] 296求調(diào)劑 +4 | 汪?! 2026-03-25 | 7/350 |
|
|
[考研] 一志愿北化315 求調(diào)劑 +3 | akrrain 2026-03-24 | 3/150 |
|
|
[考研] 344求調(diào)劑 +3 | desto 2026-03-24 | 3/150 |
|
|
[考博] 26申博自薦 +3 | whh869393 2026-03-24 | 3/150 |
|
|
[考研] 361求調(diào)劑 +3 | Glack 2026-03-22 | 3/150 |
|