| 5 | 1/1 | 返回列表 |
| 查看: 285 | 回復: 4 | ||
| 【懸賞金幣】回答本帖問題,作者仙咸閑將贈送您 5 個金幣 | ||
[求助]
機器學習 催化 化工 已有2人參與
|
||
本人化工研一學生,研究方向是機器學習篩選催化劑,課題組也沒有人研究過這個方向。計算機零基礎小白看了文獻問了AI還是不知道該從何下手,現(xiàn)在電腦已經(jīng)下載了anaconda,有沒有UU能交流一下,現(xiàn)在很痛苦迷茫啊 |
至尊木蟲 (文壇精英)
銀蟲 (小有名氣)
|
第一步:先把環(huán)境跑通 你已經(jīng)裝了 Anaconda,這超級好!接下來做這幾件事(每步 5–10 分鐘): 打開 Anaconda Navigator(開始菜單搜這個圖標) 點開后,左側選 Environments 點 Create 新建一個環(huán)境,名字起個好記的,比如 ml_chem 或 catalyst_ml Python 選 3.10 或 3.11(推薦 3.10,兼容性最好) 在新環(huán)境里裝核心包(圖形界面最簡單) 選剛剛建的環(huán)境 → 搜索框輸入下面這些包,一個個勾選安裝(改搜索范圍為 “All”): rdkit(必須,處理分子 SMILES、指紋) pandas(讀表格) numpy scikit-learn(機器學習基礎) xgboost(最好用的梯度提升模型) matplotlib(畫圖) seaborn(更好看的圖) jupyterlab(推薦,比老 Jupyter 好用) 點 Apply 安裝(可能要等 5–15 分鐘) 裝完后回到 Home 標簽,選你的新環(huán)境,點 Launch JupyterLab 測試環(huán)境是否 OK(新建 notebook 跑下面代碼)新建一個 notebook,粘貼運行:Pythonfrom rdkit import Chem from rdkit.Chem import Draw mol = Chem.MolFromSmiles('c1ccccc1') # 苯環(huán) Draw.MolToImage(mol) # 如果彈出苯環(huán)結構圖,就成功! import pandas as pd print(pd.__version__) # 看到版本號就 OK import xgboost print(xgboost.__version__) 如果苯環(huán)圖出來了 + 版本號正常 → 環(huán)境就通了!恭喜你已經(jīng)跨過最大門檻。 小建議(避免踩坑) 以后裝包優(yōu)先用 conda install -c conda-forge xxx(比 pip 穩(wěn)) 遇到權限問題(WinError 5),以管理員打開 Anaconda Prompt 再裝 別在 base 環(huán)境里亂裝東西,始終用你新建的 ml_chem 環(huán)境 第二步:明確一個小目標(別一下想篩所有催化劑) 你方向是篩催化劑,但范圍太廣容易迷失。先定一個小而具體的子問題,比如: “我想預測 Suzuki 偶聯(lián)里哪種膦配體產(chǎn)率高” “我想篩哪種金屬鹽在 CO2 還原里活性好” “我想看不同溶劑對某反應轉化率的影響” 定好后,再去文獻里找對應數(shù)據(jù)(后面我可以幫你推薦關鍵詞或數(shù)據(jù)集)。 第三步:數(shù)據(jù)從哪里來(最現(xiàn)實的起步) 先別自己做實驗(太慢) 從論文 Supporting Information 里扒表格(最常見辦法) 推薦搜索:"high-throughput" OR "parallel synthesis" + 你關心的反應 + "supplementary excel" 或 "dataset" 目標:先搞到 100–300 條數(shù)據(jù)(催化劑/配體/底物 SMILES + 產(chǎn)率/TOF 等) 用 Excel 建一個主表,列名建議全英文 + 下劃線(方便后續(xù) pandas 讀)。核心列必須有,可選列根據(jù)你方向加。每填一個 SMILES 就用 RDKit 測試一下能不能解析 建好 50–100 條后,就可以: 用 pandas 讀入 RDKit 生成催化劑/底物指紋 XGBoost / RF 做回歸(預測 yield)或分類(預測 Top 催化劑) 評估 R² / Top-k acc |
至尊木蟲 (文壇精英)
| 5 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 322求調劑 +7 | 宋明欣 2026-03-27 | 7/350 |
|
|---|---|---|---|---|
|
[考研] 一志愿北京化工大學材料與化工(085600)296求調劑 +11 | 稻妻小編 2026-03-26 | 11/550 |
|
|
[考研] 071000生物學求調劑,初試成績343 +7 | 小小甜面團 2026-03-25 | 7/350 |
|
|
[考研] 壓國家一區(qū)線,求導師收留,有恩必謝! +7 | 迷人的哈哈 2026-03-28 | 7/350 |
|
|
[考研] 復試調劑 +3 | raojunqi0129 2026-03-28 | 3/150 |
|
|
[考研] 材料與化工272求調劑 +9 | 阿斯蒂芬2004 2026-03-28 | 9/450 |
|
|
[考研] 調劑 +3 | 好好讀書。 2026-03-28 | 3/150 |
|
|
[考研] 材料277求調劑 +7 | min3 2026-03-24 | 7/350 |
|
|
[考研] 一志愿南昌大學324求調劑 +7 | hanamiko 2026-03-27 | 7/350 |
|
|
[考研] 340求調劑 +5 | jhx777 2026-03-27 | 5/250 |
|
|
[考研] 285求調劑 +4 | AZMK 2026-03-27 | 7/350 |
|
|
[考研] 一志愿吉大071010,316分求調劑 +3 | xgbiknn 2026-03-27 | 3/150 |
|
|
[考研]
|
鐘llll 2026-03-26 | 4/200 |
|
|
[考研] 329求調劑 +5 | 1() 2026-03-22 | 5/250 |
|
|
[考研] 263求調劑 +6 | yqdszhdap- 2026-03-22 | 10/500 |
|
|
[考研] 機械學碩總分317求調劑!。。 +4 | Acaciad 2026-03-25 | 4/200 |
|
|
[考研] 302求調劑 +4 | 錦衣衛(wèi)藤椒 2026-03-25 | 4/200 |
|
|
[考研] 282求調劑 +3 | wcq131415 2026-03-24 | 3/150 |
|
|
[考研]
|
黃粱一夢千年 2026-03-24 | 3/150 |
|
|
[考研] 一志愿河北工業(yè)大學0817化工278分求調劑 +7 | jhybd 2026-03-23 | 12/600 |
|