| 24小時(shí)熱門(mén)版塊排行榜 |
| 5 | 1/1 | 返回列表 |
| 查看: 331 | 回復(fù): 4 | ||
| 【懸賞金幣】回答本帖問(wèn)題,作者仙咸閑將贈(zèng)送您 5 個(gè)金幣 | ||
| 當(dāng)前只顯示滿足指定條件的回帖,點(diǎn)擊這里查看本話題的所有回帖 | ||
仙咸閑新蟲(chóng) (初入文壇)
|
[求助]
機(jī)器學(xué)習(xí) 催化 化工 已有2人參與
|
|
本人化工研一學(xué)生,研究方向是機(jī)器學(xué)習(xí)篩選催化劑,課題組也沒(méi)有人研究過(guò)這個(gè)方向。計(jì)算機(jī)零基礎(chǔ)小白看了文獻(xiàn)問(wèn)了AI還是不知道該從何下手,現(xiàn)在電腦已經(jīng)下載了anaconda,有沒(méi)有UU能交流一下,現(xiàn)在很痛苦迷茫啊 |
新蟲(chóng) (初入文壇)
至尊木蟲(chóng) (文壇精英)
銀蟲(chóng) (小有名氣)
|
第一步:先把環(huán)境跑通 你已經(jīng)裝了 Anaconda,這超級(jí)好!接下來(lái)做這幾件事(每步 5–10 分鐘): 打開(kāi) Anaconda Navigator(開(kāi)始菜單搜這個(gè)圖標(biāo)) 點(diǎn)開(kāi)后,左側(cè)選 Environments 點(diǎn) Create 新建一個(gè)環(huán)境,名字起個(gè)好記的,比如 ml_chem 或 catalyst_ml Python 選 3.10 或 3.11(推薦 3.10,兼容性最好) 在新環(huán)境里裝核心包(圖形界面最簡(jiǎn)單) 選剛剛建的環(huán)境 → 搜索框輸入下面這些包,一個(gè)個(gè)勾選安裝(改搜索范圍為 “All”): rdkit(必須,處理分子 SMILES、指紋) pandas(讀表格) numpy scikit-learn(機(jī)器學(xué)習(xí)基礎(chǔ)) xgboost(最好用的梯度提升模型) matplotlib(畫(huà)圖) seaborn(更好看的圖) jupyterlab(推薦,比老 Jupyter 好用) 點(diǎn) Apply 安裝(可能要等 5–15 分鐘) 裝完后回到 Home 標(biāo)簽,選你的新環(huán)境,點(diǎn) Launch JupyterLab 測(cè)試環(huán)境是否 OK(新建 notebook 跑下面代碼)新建一個(gè) notebook,粘貼運(yùn)行:Pythonfrom rdkit import Chem from rdkit.Chem import Draw mol = Chem.MolFromSmiles('c1ccccc1') # 苯環(huán) Draw.MolToImage(mol) # 如果彈出苯環(huán)結(jié)構(gòu)圖,就成功! import pandas as pd print(pd.__version__) # 看到版本號(hào)就 OK import xgboost print(xgboost.__version__) 如果苯環(huán)圖出來(lái)了 + 版本號(hào)正常 → 環(huán)境就通了!恭喜你已經(jīng)跨過(guò)最大門(mén)檻。 小建議(避免踩坑) 以后裝包優(yōu)先用 conda install -c conda-forge xxx(比 pip 穩(wěn)) 遇到權(quán)限問(wèn)題(WinError 5),以管理員打開(kāi) Anaconda Prompt 再裝 別在 base 環(huán)境里亂裝東西,始終用你新建的 ml_chem 環(huán)境 第二步:明確一個(gè)小目標(biāo)(別一下想篩所有催化劑) 你方向是篩催化劑,但范圍太廣容易迷失。先定一個(gè)小而具體的子問(wèn)題,比如: “我想預(yù)測(cè) Suzuki 偶聯(lián)里哪種膦配體產(chǎn)率高” “我想篩哪種金屬鹽在 CO2 還原里活性好” “我想看不同溶劑對(duì)某反應(yīng)轉(zhuǎn)化率的影響” 定好后,再去文獻(xiàn)里找對(duì)應(yīng)數(shù)據(jù)(后面我可以幫你推薦關(guān)鍵詞或數(shù)據(jù)集)。 第三步:數(shù)據(jù)從哪里來(lái)(最現(xiàn)實(shí)的起步) 先別自己做實(shí)驗(yàn)(太慢) 從論文 Supporting Information 里扒表格(最常見(jiàn)辦法) 推薦搜索:"high-throughput" OR "parallel synthesis" + 你關(guān)心的反應(yīng) + "supplementary excel" 或 "dataset" 目標(biāo):先搞到 100–300 條數(shù)據(jù)(催化劑/配體/底物 SMILES + 產(chǎn)率/TOF 等) 用 Excel 建一個(gè)主表,列名建議全英文 + 下劃線(方便后續(xù) pandas 讀)。核心列必須有,可選列根據(jù)你方向加。每填一個(gè) SMILES 就用 RDKit 測(cè)試一下能不能解析 建好 50–100 條后,就可以: 用 pandas 讀入 RDKit 生成催化劑/底物指紋 XGBoost / RF 做回歸(預(yù)測(cè) yield)或分類(lèi)(預(yù)測(cè) Top 催化劑) 評(píng)估 R² / Top-k acc |
至尊木蟲(chóng) (文壇精英)
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 279求調(diào)劑 +3 | 學(xué)而思兮知 2026-04-01 | 3/150 |
|
|---|---|---|---|---|
|
[考研] 081200-11408-276學(xué)碩求調(diào)劑 +5 | 崔wj 2026-03-26 | 5/250 |
|
|
[考研] 319求調(diào)劑 +9 | 太容易1018 2026-04-01 | 9/450 |
|
|
[考研] 085601材料工程找調(diào)劑 +20 | oatmealR 2026-03-29 | 21/1050 |
|
|
[考研] 086502化學(xué)工程342求調(diào)劑 +7 | 阿姨復(fù)古不過(guò) 2026-03-27 | 7/350 |
|
|
[考研] 材料與化工調(diào)劑一志愿大連海事085600,349 +9 | 吃的不少 2026-03-30 | 9/450 |
|
|
[考研] 土木304求調(diào)劑 +3 | 兔突突突, 2026-03-31 | 3/150 |
|
|
[考研] 085900土木水利336分求調(diào)劑 +3 | Zhangjiangj 2026-03-31 | 5/250 |
|
|
[考研] 土木304求調(diào)劑 +5 | 頂級(jí)擦擦 2026-03-31 | 5/250 |
|
|
[考研] 375求調(diào)劑 +7 | 雨夏整夜 2026-03-29 | 7/350 |
|
|
[考研] 329求調(diào)劑,一志愿西北工業(yè)大學(xué),材料工程(085601) +6 | 小小機(jī)靈蟲(chóng) 2026-03-29 | 12/600 |
|
|
[考研] 322求調(diào)劑:一志愿湖南大學(xué) 材料與化工(085600),已過(guò)六級(jí)。 +10 | XX小鄧 2026-03-29 | 10/500 |
|
|
[考研] 353求調(diào)劑 +3 | 江上楓_26 2026-03-28 | 3/150 |
|
|
[考研] 303求調(diào)劑 +7 | DLkz1314. 2026-03-30 | 7/350 |
|
|
[考研] 285求調(diào)劑 +6 | AZMK 2026-03-29 | 9/450 |
|
|
[考研] 一志愿華中師范化學(xué)332分求調(diào)劑 +3 | Lyy930824@ 2026-03-29 | 3/150 |
|
|
[考研] 調(diào)劑考研 +3 | 王杰一 2026-03-29 | 3/150 |
|
|
[考研] 085602 化工專(zhuān)碩 338分 求調(diào)劑 +12 | 路癡小琪 2026-03-27 | 12/600 |
|
|
[考研] 321求調(diào)劑 +6 | wasdssaa 2026-03-26 | 6/300 |
|
|
[考研] 打過(guò)很多競(jìng)賽,085406控制工程300分,求調(diào)劑 +3 | askeladz 2026-03-26 | 3/150 |
|