アルコールとデータサイエンス
これまでの「アルコールとデータサイエンス」のシリーズで、
- アルコール飲料とデータサイエンスの関係性
- 機械学習の大まかな分類とそれぞれの特徴
については紹介させていただくことができたと思います。
では、最後にユーグレナ先端技術研究課で行われている日本酒などのアルコール飲料に対する研究について、ご紹介させていただきたいと思います。
サルファーインデックス
以前の記事で紹介させていただきましたが、ユーグレナが特許を取得している解析技術に「サルファーインデックス」と呼ばれるものがあります。
サルファーインデックス技術は、硫黄化合物に特異的な誘導体化試薬を用いたLC-MS/MSを実施することにより、一般的な手法では検出できない微量な硫黄化合物の高感度かつ網羅的な検出や、有機硫黄化合物、無機硫黄化合物、さらには酸化型、還元型を問わず約50種類の硫黄化合物を同時に分析することができる技術です。
サルファーインデックス受託分析サービス
これがこれまでのアルコール飲料の話とどのような関係にあるのか。サルファーインデックスは、生物内で行われる無数の参加還元反応で多く使われている硫黄化合物の量を測定するために開発されたものです。これを調べることによって、生物内でどのような酸化還元反応が行われているのかを理解することができます。
また、日本酒やワインなどのアルコール飲料は、酵母などの菌類が様々な物質を発酵させることによってアルコールを作り出すプロセスに基づいて作られます。つまり、日本酒やワインの味わいには、菌類の活動が深くかかわっているのです。
サルファーインデックスを用いたアルコール飲料の解析
ユーグレナ先端技術研究課では、このサルファーインデックス技術ををつかって、アルコール飲料を分析する研究を行ってきました。開発者である大津先生の研究によれば、ビールをサンプルにした研究において、異なるサンプルのグループ間で差が見られたとのことです。
この研究では、多次元尺度法と呼ばれる機械学習を使うことで結果を解釈しています。これは前の記事で紹介させていただいた教師なし機械学習の一種で、データの中にある関係性を見るときに有効です。

この研究結果を踏まえると、サルファーインデックスは様々な発酵食品に対して、その分類や味わいの判断のために有効であると考えられます。先端技術研究課では、サルファーインデックスのPoCとしてもう一つ、アルコール飲料である日本酒に関しても分析しました。その結果の一部が次のようになります。

左がサルファーインデックスを含むメタボロミクスデータを次元削減したもの、真ん中が日本酒で定量的な評価として使われていた日本酒度と酸度でプロットしたもの、右が日本酒の専門家の方々に官能評価をしていただき、その結果を2次元にマッピングしたものです。
それぞれの関係性がわかりやすいように、専門家の方に行っていただいた官能評価(右図)をk平均法で色付けし、左の2つのプロットでも同じ色付けを行った形になります。これを見ると真ん中の日本酒度と酸度のプロットより、左のメタボロームデータを次元削減した結果の方が同じ色のグループがきれいに分離しているように見えます。
ビールや日本酒のようなアルコール飲料は、その生成過程に菌の活動が深くかかわっています。そのような食品の相対的な関係性を理解したいときには、サルファーインデックスという硫黄化合物の網羅的な解析技術や機械学習の中の次元削減と呼ばれる手法が役に立ちます。今回の解析のように味わいの近いに日本酒などがわかることによって、今後の商品戦略や顧客分析に対しての有効な情報源になることが考えられます。
サルファーインデックス受託分析サービスのご紹介
これまでになかった新しいデータと、近年便利に活用することができるのようになったデータサイエンスの手法をもとに、新たな知見やインサイトを得ることは可能です。サルファーインデックスは、今後様々な食品の分析に活用されることが期待されます。サルファーインデックスのご活用に興味を持たれた方は、下のリンクからご参照ください。
https://www.euglena.jp/businessrd/rd/sulfurindex/

以上で「アルコールとデータサイエンス」の全三回とさせていただきます。最後までご覧いただきありがとうございます。