#03
化学・素材メーカーにヒアリング
見えてきた化学業界の研究開発が直面する課題とは
化学品などの材料開発には膨大な時間や費用がかかります。そこで、材料開発にAIやビッグデータなどを活用し、効率化させようとする「マテリアルズ・インフォマティクス」(以下MIと表記)が注目を集めています。しかしながら、MIの活用の一歩目となるデータ整備をはじめ、滞りなく進められる企業は少ないのが実情です。
弊社では、材料開発プロセスの中でも上流の技術調査や材料設計を支援する独自のMI技術である「Chemicals Informatics®」(以下CIと表記)を開発する際、化学・素材メーカー20社以上にヒアリングしました。その結果、化学業界が抱える課題が見えてきました。本記事ではMI活用で陥りやすい点をご紹介し、その課題解決のためのご提案をさせていただきます。
※なお、本記事は「Ledge.ai」(AI関連メディア)で開催されましたウェビナーの内容を 抜粋したものです。全容は「MIを進める際のつまずきやすい点と解決策 研究開発者が解説」をダウンロードしてご覧いただけます。当該記事には事例も数多くご紹介しています。
化学業界での研究開発部門が抱える課題とは?
化学業界では新しい機能性化学品を開発しシェアを獲得していくことが、今後の持続的な成長のためには急務となります。各社をヒアリングした結果、見えてきた課題をいくつか挙げてみます。
研究開発が属人的になってしまう
経験豊富で勘の良い研究者は「このあたりに化合物がありそう」「このような配合にすればよさそう」と感覚的に抽出し、導き出すことができます。
しかし、経験が浅い研究者の場合はなかなかそうはいきません。
研究開発機能が属人的になってしまうと、企業の競争力にも影響を及ぼしかねず、リスクの高い状態と言えるのではないでしょうか。
人材不足
計算科学や情報システム工学と、化学の両方を理解している人材が少ないという現状があります。これはMI分析に限ったことではありませんが、アメリカと比較すると日本企業のデータ活用や情報システム活用は遅れを取っているという印象があります。
日本企業でもデータサイエンティストの育成を進めたり、MI推進組織を立ち上げたりしていますが、肝心の人材不足は否めません。
データ不足
どれだけデータサイエンティストを増やしても、データが少なければ成果は限られてしまいます。データが少ない状態でAI開発をスタートしたために失敗するケースも少なくありません。
新素材の開発を進める上で、必要なデジタル人材の育成・確保は周知の課題として常に取り上げられますが、一朝一夕に解決できるものではありません。一方で、AIやビッグデータなど新たな情報やデータを有効活用することで、競争力の強化は図れるのではないでしょうか。それは開発スピードの加速化にもつながります。
MIを活用したい企業が“頓挫”しやすいポイントとは?
研究開発のプロセスにおいて、大きな障壁となるのが実験回数の多さです。
従来は材料候補を使って実際に合成評価をおこない、目的の特性が出なければ、別の条件で実験を繰り返していました。実験回数を減らすために、シミュレーション技術を利用する取り組みもありますが、シミュレーションは時間や手間もかかります。コンピューターの性能も求められるため、シミュレーションにかけられる回数自体も実際には限られてしまうのです。
シミュレーションの回数を抑えるために必要なこと、それは候補となる材料を絞り込むことです。
この絞り込む作業を、これまでは化学者の熟練した技術や知見、経験をもとに進めてきたわけですが、網羅性が下がったり見落としたりする可能性も考えられます。
またデータをもとに材料を絞り込むためには、相当数のデータが必要になります。このデータを揃えることに苦慮されているという企業も多いと聞きます。
MIシステムは自社でデータをもっていることが前提となっている場合がほとんどです。そのため、データが少ない状態で始めてしまうと、精度が上がらず実用化に至らない「PoC止まり」になってしまうことがあります。
また、自社のデータをもとにして進めるMIは、限られた分野の予測精度を高めることには有効な場合があります。しかし、既存の材料の配合比をチューニングすることに固執してしまう状況を招くことがあり、結果的に特性値や物性値を高めるうえで制約が出てしまうケースが考えられます。
このようなケースを解決するためにも、バイアスのない社外のデータを追加し、より幅広い候補材料の中から選定されることをおすすめします。社外のデータを活用することで、今までの材料だけでは達成できなかった特性を得られる場合があります。
開発プロセスの上流工程の効率化で競合他社より優位に
日立ハイテクは材料開発プロセスの中でも上流の技術調査や材料設計を支援する独自のMI技術であるCIを開発しました。
これは、自社データの活用を基本とする一般的なMIソリューションとは一線を画し、公開データをベースとしたものです。
公開化合物データベースに掲載される1億1,100万件の既知化合物や新規性のある化合物1,200万件、およびそれらに関連する5,100万件の特許データや4,000万件の論文データから、自然言語処理(NLP:Natural Language Processing)技術を用いて抽出した87種類の特性値情報などを独自の化合物データベースに収録しています。
また、新規化合物を生成するAIも実装しています。お客さまが既存の化合物や目的とする特性などを探索の条件として指定するだけで、独自の探索AIが有望な化合物、材料やそれらの特性の予測などを出力する仕組みです。
多くのMI技術は、お客さま側でデータを揃える作業から始めることが多いのですが、日立ハイテクのCIはすでに公開データをもとにしたデータを準備済みですので、クラウドに接続したらすぐお使いいただけるのも特長のひとつです。
MI活用をはじめる一歩目というお客さまでも上流の工程から効率化をはかれる製品ですし、すでにMI活用を進められているお客さまについても、データの幅を広げることにお役立ていただける製品です。
CIは非常に幅広い分野で用途ごとに特性値を探索できます。用途や分野ごとにフィルタリングして除外したり包含させることもできますので、お客さまが求める分野や用途ごとでご活用いただけます。
類似化合物約4,000万通りの組み合わせから、一気に探索できる他の製品は、弊社では確認できておりません。
材料開発の上流工程において幅広いデータを備えたCIを活用することで、網羅的かつ効率的に良特性が期待できる候補化合物を探索することが可能になり、後続工程である試作、実験回数の削減、開発期間の短縮に大きく貢献することができます。
材料開発のプロセスで、上流の段階でデータを豊富に揃え絞り込みをする戦略をとり、絞り込んだものに対してシミュレーションをおこない組成を選定することが効率的なMIの活用方法と言えるでしょう。