本blogに書かれている内容は、記事を書いた時点での僕の知識や調査によるものです。そのため、僕の不勉強による間違いや勘違いがか書かれていることもあり得ます。記事の内容の真偽について、ご自身できちんと確かめて下さいますようよろしくお願いいたします。また、不適切な表現や間違えについては、ご指摘頂けると助かります。

【論文】Liu J et al. Chemical Research in Toxicology (2015) [2016-001]

たまに、読んだ論文を紹介したいと思います。タイトルにある [2016-001] は、僕の文献管理番号なので、気にしないでください。

Liu J, Mansouri K, Judson R, Martin M, Hong H, Chen M, Xu X, Thomas R, and Shah I, "Predicting hepatotoxicity using ToxCast in vitro bioactivity and chemical structure", Chemical Research in Toxicology, (2015) 28 no.4, pp.738-751.

667化合物をトレーニングデータとして、長期のインビボ肝毒性について、ToXCastの711のインビトロアッセイデータと4376の分子記述子から判別モデルを構築することを試みた論文です。 インビボデータはToxRefDBから集め、分子記述子はQikPropというソフトウェアで計算したものとOpenBabel, PaDEL, PubChemから集めたとのことです。 インビボ肝毒性については、具体的には病理検査で観察された「肥大」「損傷」「増殖病変」の3つに着目しています。 また、判別モデルには6つの機械学習アルゴリズムが用いられており、どのアルゴリズムの予測精度が高いかについて議論しています。

結論としては、以下のようなことが書かれていました。

  • 判別モデルのパラメータには、分子記述子のみ用いるよりもインビトロアッセイも用いた方が予測精度があがること。
  • トレーニングデータが不均衡データ(着目しているエンドポイントで「陽性」の化合物が「陰性」の化合物より少ないこと。)なので、「陰性」化合物を減らして均衡データにした方が予測精度があがること。
  • クロスバリデーションで予測精度を定量化したところ、3つのエンドポイントいずれについても、80%程度の予測精度が達成されたこと。

いずれも「まあ、そうだろうな。」という感じの結論ですが、長期のインビボ肝毒性をターゲットにしている論文は少ない気がしたので、紹介することにしました。 また、僕もデータベースを用いた研究をしているのでよくわかりますが、これだけのデータを整理するのは大変だっただろうなと思います。