タイトル: | 特許公報(B2)_質量分析データ解析装置及びプログラム |
出願番号: | 2007528233 |
年次: | 2010 |
IPC分類: | G01N 27/62 |
山内 一夫 山本 善丈 梅村 佳克 JP 4502009 特許公報(B2) 20100430 2007528233 20060427 質量分析データ解析装置及びプログラム 株式会社島津製作所 000001993 小林 良平 100095670 山内 一夫 山本 善丈 梅村 佳克 JP 2005141845 20050513 20100714 G01N 27/62 20060101AFI20100624BHJP JPG01N27/62 D G01N27/62-27/70 H01J49/00-49/48 JSTPlus(JDreamII) 特開2005−091344(JP,A) 特表2005−510732(JP,A) 特表2003−526793(JP,A) 3 JP2006308909 20060427 WO2006120928 20061116 9 20071107 島田 英昭 本発明は、質量分析によって得られたデータを解析することにより、質量スペクトル上の各イオンピークの価数の判定及びモノアイソトピックピークの同定を行うための質量分析データ解析装置に関する。 従来、質量分析によって得られたデータを解析する際に、非特許文献1及び2に記載のように、質量スペクトルを表すデータとして、連続して検出されるイオンのm/z値(質量電荷比)及びその検出強度によって質量スペクトルを表したプロファイルデータを使用する方法が知られている。プロファイルデータは、質量分析装置の生データ(Raw Data)に相当するデータ形態であり、該プロファイルデータを用いた従来の質量分析データ解析方法においては、プロファイルデータ上の各ピークの形状をパターン認識アルゴリズムによって解析することで同位体クラスター(同一の元素組成を有するイオンに由来し、イオン中の同位体組成の違いによって異なるm/z値を示す複数本のピークから成るピーク群)を同定し、その結果に基づいて各ピークの価数やモノアイソトピックピーク(同位体クラスターの代表となるイオンのピーク。通常は天然存在比が最大の同位体から構成されるイオンのピークを指す。)の同定を行っていた。ジャーナル・オブ・ジ・アメリカン・ソサエティー・フォー・マススペクトロメトリー(Journal of the American Society for Mass Spectrometry)、(米国)、2000年、第11巻、pp.320-332ジャーナル・オブ・ジ・アメリカン・ソサエティー・フォー・マススペクトロメトリー(Journal of the American Society for Mass Spectrometry)、(米国)、1995年、第6巻、pp.229-233 上記のような質量分析データ解析方法は、例えば、質量分析装置のデータを分析完了後にオフラインで解析するための「タンパク質解析ソフトウェア」等に利用されている。しかし、質量分析によるタンパク質解析等においては、四重極型イオントラップ(Quadrupole Ion Trap;QIT)を用いた衝突誘起分解(Collision Induced Dissociation;CID)などによって特定のピークに対応するイオンの捕捉と開裂を行う、いわゆるMS/MS分析(又はMSn分析)が広く行われており、そこでは、分析中に動的にプリカーサイオンを選択する機能(Data Dependent Acquisition;DDA機能)が必要とされることが多い。 一般にMS/MS分析では、まず、分析対象物から特定の質量電荷比(m/z)を有するイオンをプリカーサイオンとして選別し、該プリカーサイオンをCIDによって開裂させて生成したイオン(プロダクトイオン)を質量分析することによって、目的とするイオンの質量や化学構造についての情報を取得する。そのため、DDA機能を実現するためには、分析実行中に(すなわちオンラインで)質量スペクトルの中から、プリカーサイオンとして選択するべきピークの価数を判定すると共に、該ピークがモノアイソトピックピークであるか否かを自動的に判定する機能が必要となる。 質量スペクトルにおけるピークの価数の判定やモノアイソトピックピークの同定を行う技術は、上述のように、従来のプロファイルデータを用いた解析を行うオフライン解析用のソフトウェア等で実現されているが、このような従来の解析方法では、解析処理に多くの時間を要するため、分析実行中にオンラインで行うDDA機能を実現することはできなかった。 そこで、本発明が解決しようとする課題は、質量スペクトル上の各ピークの価数の判定及びモノアイソトピックピークの同定を、短時間で行うことのできる質量分析データ解析装置を提供することである。 上記課題を解決するために成された本発明に係る質量分析データ解析装置は、質量分析によって取得された質量スペクトルデータを解析することにより、該質量スペクトルにおける各イオンピークの価数の判定及びモノアイソトピックピークの同定を行うための質量分析データ解析装置において、 a)前記質量スペクトルデータとして取得されたプロファイルデータを基にセントロイドデータを作成するセントロイドデータ作成手段と、 b)前記セントロイドデータ上のピークの出現パターンに基づいて質量スペクトル上の同位体クラスターを検出し、その結果に基づいて該同位体クラスターに属するピークの価数の判定、及び該同位体クラスターのモノアイソトピックピークの同定を行うデータ解析手段と、 を有することを特徴とする。 ここで、セントロイドデータとは、質量スペクトルを表すためのデータ形態の一つであり、質量スペクトル上の各ピークを、そのピークの重心を表すm/z値とそのピークの面積値の2つの値で表したものである。 更に、上記本発明の質量分析データ解析装置は、上記データ解析手段が、 c)上記セントロイドデータ上のピークを強度が大きいものから順に同位体クラスター同定のための基準ピークとして指定する基準ピーク指定手段と、 d)前記基準ピークの前後に並ぶピークの出現パターンを、所定の価数範囲における同位体クラスターのピーク出現パターンと比較するパターンマッチング手段と、 e)前記パターンマッチング手段による比較の結果、前記基準ピークとその前後に並ぶピークの出現パターンが前記同位体クラスターの出現パターンと一致していた場合に、該基準ピークを含む同位体クラスターの価数の決定、及び該同位体クラスターに属するピークの決定を行う同位体クラスター同定手段と、 f)前記同位体クラスター同定手段によって決定された同位体クラスターの価数を該同位体クラスターに属するピークの価数として決定するピーク価数判定手段と、 g)該同位体クラスター中で質量電荷比が最も小さいピークをモノアイソトピックピークとするモノアイソトピックピーク同定手段と、 を有するものとすることが望ましい。 また更に、本発明の質量分析データ解析装置は、上記同位体クラスター同定手段が、同位体クラスターに属するピークを決定する際に、上記基準ピーク又は該同位体クラスターに属するピークとして既にマッチングされたピークに対する相対強度を利用して、該同位体クラスターに属する各ピーク候補の選別を行うものとすることがより望ましい。 また、本発明に係るプログラムは、コンピュータを上記のような質量分析データ解析装置として機能させることを特徴とするものである。 上記のような構成を有する本発明の質量分析データ解析装置によれば、解析対象となる質量スペクトルデータとしてセントロイドデータを使用することにより、従来のようなプロファイルデータを用いた解析を行うものに比べて、入力となるデータの情報量が大幅に少なくなるとともに、同位体クラスター同定のためのパターンマッチングのアルゴリズムを簡素化することができる。そのため、結果として、同位体クラスターの同定や、各ピークの価数の判定、及びモノアイソトピックピークの同定のための処理に要する時間を大幅に削減することが可能となる。 また、本発明の質量分析データ解析装置を、上記のような基準ピーク指定手段、パターンマッチング手段、同位体クラスター同定手段、ピーク価数判定手段、及びモノアイソトピックピーク同定手段を有するものとした場合には、質量スペクトルの中で、より強度が大きいピークから順番に、該ピークの前後のピークに対してパターンマッチングを行うため、その際に、基準ピークや既にその同位体クラスターに属する同位体ピークとしてマッチングされたピークに対する相対強度に基づいて、その同位体クラスターに属するべき各ピークの候補を選別することができる。本発明の質量分析データ解析装置をこのような選別を行うものとした場合には、ノイズ等のピークを誤って同位体クラスターに含めてしまうといったマッチングミスを低減することができ、高い解析精度を確保することが可能となる。本実施例の質量分析データ解析装置の概略構成を示す図。同実施例の質量分析データ解析装置におけるデータ処理の手順を示すフローチャート。同実施例の質量分析データ解析装置におけるセントロイドデータを用いたパターンマッチング処理の概念図。同実施例の質量分析データ解析装置によって同定された同位体クラスターピークの例、(a)はPEGの質量スペクトルにおいて、1価と同定された同位体クラスターの例であり、(b)はインスリンの質量スペクトル上において、6価と同定された同位体クラスターの例である。符号の説明10…LCMS-IT-TOF装置20…分離/検出部21…イオン化部22…イオントラップ型質量分離部23…飛行時間型質量分離部24…イオン検出部30…制御/処理部31…制御部32…データ処理部 以下、実施例を用いて本発明を実施するための最良の形態について説明する。[実施例] 本実施例の質量分析データ解析装置は、イオントラップと飛行時間型質量分析計を備えた液体クロマトグラフ質量分析装置(LCMS-IT-TOF(株式会社島津製作所の登録商標))10に含まれるコンピュータに、本発明に係る質量分析データ解析のためのプログラムを搭載したものであり、該LCMS-IT-TOF装置10の一部として動作するものである。なお、このコンピュータは、該LCMS-IT-TOF装置10の一部に組み込まれたものであってもよいし、市販のパーソナルコンピュータを用いるものであってもよい。 本実施例に係るLCMS-IT-TOF装置10は、図1に示すように、大きく分けて分離/検出部20と制御/処理部30から成る。分離/検出部20は、分析する試料をエレクトロスプレーイオン化法(Electrospray Ionization; ESI)によってイオン化するイオン化部21と、所定のm/z値を有するイオンをプリカーサイオンとして選択すると共に、該プリカーサイオンを開裂させてプロダクトイオンを生成する機能を備えた四重極イオントラップ型質量分離部22、及び、イオンをm/z値に基づいて分離する飛行時間型質量分離部23と、イオン検出部24とを備えている。 制御/処理部30は、LCMS-IT-TOF装置10に含まれるコンピュータによって実現されるものであり、分離/検出部20の各部を制御する制御部31と、イオン検出部24からの信号を処理して所定の解析を行うためのデータ処理部32を備えている。データ処理部32は、質量スペクトルデータを作成すると共に、該質量スペクトルデータに基づく同位体クラスターの検出、ピーク価数の判定及びモノアイソトピックピークの同定等の処理を行うものであり、その機能は、前記コンピュータに搭載された本発明に係るプログラムによって達成される。 以下、本実施例の質量分析データ解析装置を用いたデータ処理の手順について、図2のフローチャート、及び図3の概念図を用いて説明する。 まず、イオン検出部24からの信号に基づいて作成された質量スペクトルのプロファイルデータを変換してセントロイドデータを作成する(S1)。該セントロイドデータは、各ピークのm/z値、強度、同位体ピークの場合、その同位体クラスターのID番号、価数、モノアイソトピックピークであるかどうかのフラグ等の情報を含む構造体のリスト(インデックスはm/z値の順に並んでいる)から成る(但し、解析前の状態では、前記同位体クラスターID番号、価数、モノアイソトピックピークに関する情報は空白となっている)。 まず、上記セントロイドデータに強度順にアクセスするために、セントロイドデータ上の各ピークの強度が降順になるように並べた各ピークのインデックスリスト(強度降順インデックスリスト)を作成する(S2)。次に、これから見つけようとする同位体クラスターのID番号(クラスターインデックス値)及び上記強度降順インデックスリストのインデックス値を初期化(S3, S4)した後、セントロイドデータ上で、まず、同位体クラスターパターンを探すための基準となるピーク(基準ピーク)の候補となるピークを決定する(S5)。ここで、強度の大きい順に基準ピークとなるピークを選択するので、最初の処理ではベースピーク(測定されたピークの中で最大の強度を有するピーク、図3ではAのピーク)が基準ピークとなる。なお、2回目以降の処理では、それ以前の処理によって、既に同位体クラスターに属するピークとして同定されたピークは、基準ピークとして選択しないようにする。 次に、上記基準ピークを中心として、その周りのピークパターンを調べ、各価数の同位体クラスターにおけるピークの出現パターンに、該ピークパターンが一致するか否かを判定する(この処理を価数パターンマッチングと呼ぶ、S7)。 このとき、価数パターンマッチングの際のパラメータとして、以下の値を設定する。(1)同位体クラスターを探すための価数範囲(デフォルト値:1〜10価)(2)同位体クラスターに属するピークを探すための分解能の許容範囲(デフォルト値:±50ppm)(3)同位体クラスターを構成すると見なすピーク数の最小値(デフォルト値:3)(4)クラスター前方マッチング最大しきい値(詳細は後述する)(デフォルト値:0.3)(5)隣接ピークマッチングしきい値(詳細は後述する)(デフォルト値:0.05) 価数パターンマッチングは、基準ピークのm/z値の位置から、該基準ピークが各価数の同位体クラスターに含まれると仮定したときに想定されるステップ幅分ずつ離れた位置に、(上記パラメータで指定した分解能の許容範囲内で)ピークが存在するか否かを調べることによって行われる。例えば、基準ピークが1価の同位体クラスターに含まれるものであった場合には、該同位体クラスターに属する複数のピークは、m/z値が1ずつ異なるピークパターンを示すため、前記ステップ幅は1となり(図3の同位体クラスター1)、2価の同位体クラスターに含まれるものであった場合には、該同位体クラスターに属するピークはm/z値が1/2ずつ異なるピークパターンを示すため、上記ステップ幅は1/2となる(図3の同位体クラスター2)。 但し、基準ピークより前方にあるピーク(前方ピーク)に対しては、基準ピークのマス値(m/z値に、仮定した価数zを掛けた値、単位[Da])に応じて変化させた基準ピークに対する相対強度のしきい値(このしきい値の上限値が、「クラスター前方マッチング最大しきい値」である)を設定し、このしきい値以下の強度を持つピークは、マッチングの際に、同位体クラスターに属するピークの候補から外すようにする。例えば、図3において矢印で示したピークは、基準ピークAを含む1価の同位体クラスターのピークパターンにマッチするものの、基準ピークAに対する相対強度がしきい値以下であるため、ノイズであると判断され、同位体クラスター1に属するピークの候補から除外される。 更に、既にその同位体クラスターに属するピークとしてマッチされた隣接するピークに対する相対強度によって、マッチングのための強度の上下限値(これを「隣接ピークマッチングしきい値」とよぶ)を決め、その上下限値から外れた強度を持つピークは同位体クラスターピークの候補から外すようにする。例えば、隣接ピークに対する相対強度しきい値が0.05の場合、隣接するピークの強度が100のときには、100×0.05=5以上、かつ100/0.05=2000以下となる。また、既に同位体クラスターに属するピークとして同定されているピークもマッチングの対象から除外される。 上記価数パターンマッチングにおいて、基準ピークを中心としたピークパターンとマッチした同位体クラスター価数パターンのうち、マッチング分解能(同位体クラスターに属する各ピークを探す際の測定値と予測値の差の標準偏差)が最も小さい同位体クラスター価数パターンを選出する(マッチした価数パターンが一つであった場合には該価数パターンに決定する)ことによって、同位体クラスターを同定する(S9)。 続いて、S9によって選択された価数パターンの価数を、同定された同位体クラスターに属する各ピークの価数として判定すると共に、該同位体クラスターの先頭に位置するピークをモノアイソトピックピークとして同定し(S10)、上述のセントロイドデータに、同定された同位体クラスターに属する各ピークのクラスターID番号、価数、モノアイソトピックピークに関する情報を追加情報として反映させる(S11)。 その後、クラスターインデックス値及び強度降順インデックスリストのインデックス値にそれぞれ1を追加し(S12、S13)、上記S5〜S13の処理を、セントロイドデータ中の全てのピークに対して実行する。なお、価数パターンマッチング(S7)において、基準ピークの周りに同位体クラスターとしてマッチするピークパターンが存在しなかった場合(図3の基準ピークB)には、上記S9〜S12の処理をとばしてS13を実行し、次の基準ピーク(図3の基準ピークC)の決定を行う。なお、S6において、強度降順リストのインデックス値がセントロイドデータ上のデータ数以上になっていなければ、基準ピークの決定処理が正常に終了したと判定されて解析処理が継続され、そうでない場合には、異常終了と判定されて、解析処理が終了される。 以上の処理により、質量スペクトル上のピークの強度順に、順次そのピークを中心とした同位体クラスターのマッチングが行われ、同定された同位体クラスターに属するピークの価数及びモノアイソトピックピークが決定される。以上のような処理によって同定された同位体ピークの一例を図4に示す。図4(a)は、分析試料としてポリエチレングリコール(PEG)を用いた場合の質量スペクトル上において、1価と同定された同位体クラスターの例であり、図4(b)は、分析試料としてインスリンを用いた場合の質量スペクトル上において、6価と同定された同位体クラスターの例である。 [試験例] ミオグロビンを分析試料とした質量スペクトルのセントロイドデータ(m/z=400〜1500、ピーク数754)を入力とし、本実施例の質量分析データ解析装置による処理時間を測定したところ、29.4msであった。また、このときプロファイルデータをセントロイドデータに変換するのに要した時間は85.1msであり、質量スペクトルにおけるイオンピークの価数、及びモノアイソトピックピークの自動判定処理に掛かる全実行時間は、85.1+29.4=114.5msであった。これに対し、従来技術のアルゴリズムでは、1つの質量スペクトルにおいて、全同位体クラスターの同定を行うのに約2時間を要しており、本実施例の質量分析データ解析装置によって、大幅に解析時間を短縮できることが確かめられた。また、上述のDDA機能を実現するためには、1つの質量スペクトルに対して、約100msのオーダーで各ピークの価数の判定及びモノアイソトピックピークの同定を完了する必要があるが、上記試験結果から、本実施例の質量分析データ解析装置がDDA機能を十分実現することが可能なものであることが確認された。 なお、本発明の質量分析データ解析装置は、上記のようなデータ処理手順に従って質量スペクトル上の同位体クラスターの検出、ピークの価数判定、及びモノアイソトピックピークの同定のための処理を実行するソフトウェアを、上記LCMS-IT-TOF装置のようなMS/MS解析機能を備えた装置の内部に設けられたコンピュータに搭載することで、DDA機能を実現するものとしてもよいが、これに限定されるものではなく、種々の質量分析装置に接続して使用される外部のパーソナルコンピュータに上記のようなソフトウェアを搭載し、オンライン又はオフラインでのデータ解析を行うものとすることもできる。 質量分析によって取得された質量スペクトルデータを解析することにより、該質量スペクトルにおける各イオンピークの価数の判定及びモノアイソトピックピークの同定を行うための質量分析データ解析装置において、 a)前記質量スペクトルデータとして取得されたプロファイルデータを基にセントロイドデータを作成するセントロイドデータ作成手段と、 b)前記セントロイドデータ上のピークの出現パターンに基づいて質量スペクトル上の同位体クラスターを検出し、その結果に基づいて該同位体クラスターに属するピークの価数の判定、及び該同位体クラスターのモノアイソトピックピークの同定を行うデータ解析手段と、 を有し、更に上記データ解析手段が、 c)上記セントロイドデータ上のピークを強度が大きいものから順に同位体クラスター同定のための基準ピークとして指定する基準ピーク指定手段と、 d)前記基準ピークの前後に並ぶピークの出現パターンを、所定の価数範囲における同位体クラスターのピーク出現パターンと比較するパターンマッチング手段と、 e)前記パターンマッチング手段による比較の結果、前記基準ピークとその前後に並ぶピークの出現パターンが前記同位体クラスターの出現パターンと一致していた場合に、該基準ピークを含む同位体クラスターの価数の決定、及び該同位体クラスターに属するピークの決定を行う同位体クラスター同定手段と、 f)前記同位体クラスター同定手段によって決定された同位体クラスターの価数を該同位体クラスターに属するピークの価数として決定するピーク価数判定手段と、 g)該同位体クラスター中で質量電荷比が最も小さいピークをモノアイソトピックピークとするモノアイソトピックピーク同定手段と、 を有することを特徴とする質量分析データ解析装置。 上記同位体クラスター同定手段が、同位体クラスターに属するピークを決定する際に、上記基準ピーク又は該同位体クラスターに属するピークとして既にマッチングされたピークに対する相対強度を利用して、該同位体クラスターに属する各ピーク候補の選別を行うことを特徴とする請求項1に記載の質量分析データ解析装置。 コンピュータを上記請求項1又は2に記載の質量分析データ解析装置として機能させるためのプログラム。