生命科学関連特許情報

タイトル:公表特許公報(A)_熱量測定データにおける自動ピーク検出法
出願番号:2013541299
年次:2013
IPC分類:G01N 25/20


特許情報キャッシュ

チャン,ヘザー・イー−メイ JP 2013544365 公表特許公報(A) 20131212 2013541299 20111124 熱量測定データにおける自動ピーク検出法 ゼネラル・エレクトリック・カンパニイ 390041542 荒川 聡志 100137545 小倉 博 100105588 黒川 俊久 100129779 田中 拓人 100113974 チャン,ヘザー・イー−メイ US 12/957,226 20101130 G01N 25/20 20060101AFI20131115BHJP JPG01N25/20 C AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,MD,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IS,JP,KE,KG,KM,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LT,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US,UZ,VC,VN EP2011070950 20111124 WO2012072493 20120607 14 20130529 2G040 2G040AB12 2G040HA10 2G040HA18 本発明は、熱量測定機器で得られた熱量測定データの分析方法に関し、具体的には、熱量測定データにおけるピーク及び/又はピーク位置を自動的に同定する方法に関する。 示差走査熱量測定(DSC)は、熱分析に用いられる熱分析技術である。DSCは、ルーチン品質試験及び研究ツールとして広範な用途で使用されている。例えば、DSCは、化合物の安定性の研究、セキュリティスクリーニング又は薬品分析に使用し得る。 熱量測定用途では、熱量測定データの複数のピークを同定するための幾つかのピーク検出法が用いられている。これらの方法の大半は、ユーザーから提供されたピークの数及び各ピークの位置についての初期推測値を使用する。このマニュアル作業では、ユーザーは、シングルピークフィットについて視覚的に評価し、追加のピークの有無について決定する。しかし、低シグナル/高ノイズのデータでは、複数のピークはユーザーには識別不能となり、ユーザーはシングルピークと仮定せざるを得なくなる。さらに、マニュアル作業ではユーザーによるバラツキが持ち込まれる。 そこで、ユーザーには視認できないピークを含む熱量測定データのピークの数及び位置を決定するためのユーザー入力が最小限で済む熱量測定データの自動分析方法を提供することができれば望ましい。BUDAGUAN B G ET AL: "Calorimetric investigation of structural process in porous silicon", JOURNAL of NON-CRYSTALLINE SOLIDS, NORTH-HOLLAND PHYSICS PUBLISHING, AMSTERDAM, NL, vol. 204, no. 2, 1 September 1996 (1996-09-01), pages 169-171, XP004079483, ISSN: 0022-3093, DOI: 10.1016/S0022-3093(96)00403-6 abstract paragraph [3.Results] 一実施形態では、1組の熱量測定データにおける1以上の熱量測定ピークの位置を自動的に決定する方法を提供する。本方法は、a)熱量測定データに対する非線形フィットを用意する段階、b)熱量測定データから非線形フィットを減じて残差を計算する段階、c)残差に基づいて誤差を計算する段階、d)誤差を所定の誤差と比較する段階、及びe)誤差が所定の誤差よりも大きいときは、別の非線形フィットを用意する段階を含む。 別の実施形態では、1組の熱量測定データにおける1以上の熱量測定ピークの位置を自動的に決定する方法を提供する。本方法は、a)熱量測定データに対する第1の非線形フィットを用意する段階、b)熱量測定データから第1の非線形フィットを減じて第1の残差を判定する段階、c)第1の残差に基づいて第1の誤差を計算する段階、d)熱量測定データに対する第2の非線形フィットを用意する段階、e)熱量測定データから第2の非線形フィットを減じて第2の残差を判定する段階、f)第2の残差に基づいて第2の誤差を計算する段階、g)第1の誤差と第2の誤差を比較する段階、及びh)誤差が小さい方の非線形フィットを選択する段階を含む。 本発明の上記その他の特徴、態様及び利点については、図面と併せて以下の詳細な説明を参照することによって理解を深めることができるであろう。図面を通して、同様の部材には同様の符号を付した。熱量測定データの自動ピークフィッティング法の一例のフローチャート。熱量測定データデータの自動ピークフィッティング法の別の例のフローチャート。自動ピークフィッティングのための熱量測定データの一例のグラフである。図3の熱量測定データにフィットさせたピークの数に関するRMSを求めるためのグラフである。 本発明の方法の1以上の実施例は、最小限のユーザー入力で又はユーザー入力なしで人間の目では視認し難いピークを含む熱量測定ピークの数及び位置を決定するための熱量測定データの分析に関する。幾つかの実施例では、1以上の熱量測定ピークの位置を自動的に決定する方法は、最大ピークの位置に対する非線形フィットを実行する段階と、熱量測定データから非線形フィットを減じて残差を得る段階と、残差に基づいて誤差を計算する段階と、誤差を所定の誤差と比較する段階と、誤差が所定の誤差よりも大きいときは、別の非線形フィットを用意する段階とを含む。 本方法の1以上の実施例は熱量測定データの分析に用いられるが、本方法は、同様の分布を有する他のデータタイプにも適応でき、モデリングすることができる。ピークがユーザー又はオペレーターには視認できない場合にも、本発明を用いて熱量測定データのピークを決定することができる。一例では、ピークは、データのノイズレベルが高いためにピークを視認できないことがある。本方法は、分析すべきデータのタイプに適合するように修正し得る。例えば、二乗平均平方根誤差の計算に代えて、可能な評価メトリクスとして、平均二乗誤差、平均絶対誤差、カイ二乗誤差、相関係数又はコヒーレンス誤差が挙げられる。 一実施形態では、曲線のモデリングに用いられる理論的表現には、特に限定されないが、独立二状態遷移モデル、非二状態モデル、又は非独立(すなわち、協力)モデルのような熱モデルが挙げられる。一実施例では、非線形フィットは、母集団に基づくものであってもよい。例えば、ピークの形状を、実験の途中の所与の時点でアンフォールディング(変性)するタンパク質の数に関連付けることができ、ピークは、タンパク質の50%がアンフォールディングした時点で起こり、エンタルピーの積分変化を表す。非線形フィットの非限定的な例としては、ガウス、コーシー、ガウスとコーシープロフィールの加重混合、非対称ガウス、ガウスプロフィールからコーシープロフィールへの単調な遷移が挙げられる。式1〜3は、曲線のモデリングのための理論的表現の例である。モデルは、二状態遷移モデルに基づく。式1〜3は、熱量測定システムに特有のパラメーターを含む。式中、B0、B1は定数であり、ドメインA及びBはタンパク質がアンフォールディングし得る別々のステージを示し、Tは温度であり、TmAはタンパク質の50%がドメインAにおいてアンフォールディングした温度であり、Cpはモル熱容量であり、ΔCpはモル熱容量の変化であり、KAはドメインAの平衡定数であり、ΔHAはドメインAのモル熱エンタルピーの変化であり、ΔCpAはドメインAのモル熱容量の変化であり、ΔHmAは温度TmAでのドメインAのモル熱エンタルピーの変化である。 図1は、本発明の方法の一実施例のフローチャートである。段階10で、本方法は、熱量測定データに対する非線形フィットを用意することから開始する。非線形フィットの非限定的な例としては、レーベンバーグ−マルカート法又は多項式フィットが挙げられる。熱量測定データは、熱量測定デバイスから直接受信できる。熱量測定データは、例えば実験準備で以前に収集したデータを含むメモリー又はデータファイルからアクセスしてもよい。 適宜、段階12で、実験データを前処理してもよい。例えば、実験データを、ベースラインを減算するための前処理してもよい。熱量測定データからのベースライン減算は必ずしも必要でない。前処理段階の必要性は、システムの複雑さのレベルによる。前処理は、実験データのノイズレベルを低減するために実施してもよい。代替又は追加として、前処理は、実験データのノイズレベルを推定するために実施してもよい。熱量測定データは、熱量測定シグナルとベースラインの組合せを含んでいることがある。データからベースライン特徴を減じて、ノイズの低減したシグナルを得てもよい。こうしてノイズの低減したシグナルを次いで非線形曲線のフィティングに使用すればよい。熱量測定データは、ノイズ低減のための処理を行ってもよい。一実施形態では、熱量測定データからベースライン特徴を自動的に除去する方法は、1以上の多項式関数をベースラインに一度に1つずつ繰返しフィットする段階と、現在のベースライン訂正スペクトルを準備するために熱量測定スペクトルから最適多項式関数を減じる段階と、残差平方和(SSR)によって測定されたフィットの質を評価する段階と、反復ごとのSSRの変化がその元の値の所定のパーセンテージ未満になるまで続行する段階とを含む。 段階14で、熱量測定データにおける最大ピークが、フィットした非線形フィットに基づいて特定してもよい。最大ピークはまた、「最大値」又は「大域最大値」と呼ばれてもよい。一実施形態では、最大値は、温度に関するエンタルピー変化を計算することにより特定し得る。適宜、最大値の位置は記憶してもよい。一実施例では、最大値の位置及び最大値におけるモルエンタルピーの値は、記憶されても又は表示してもよい。最大値の位置は、時間若しくは温度又はそれらの両方に関して判定し得る。 段階16で、残差が非線形フィットのために判定し得る。残差は、実験データから非線形フィットを減じて取得し得る。残差は、実験データ上の様々な位置における全ての残差の和でよい。一実施形態では、残差は、熱量測定データ曲線の下の面積からフィットされた曲線の下の面積を減じて判定し得る。 段階18で、誤差が残差に基づいて計算される。一実施形態では、誤差は、残差の二乗平均平方根(RMS)である。 段階20で、非線形フィットのための計算されたRMS誤差は、所定のRMS値と比較される。フィットされたピークのためのRMS誤差が所定のRMS誤差より小さい場合は、フィットされた曲線は受け入れられる(段階22)。 RMS誤差が所定のRMS誤差よりも大きいときは、次の非線形フィットが熱量測定データに適用されることが可能であり、段階10、14、16、18及び20が繰り返されてよく、それによって、RMS誤差が計算され、RMS誤差が所定のRMS誤差と等しくなるか又はそれより小さくなるまで、所定のRMS誤差と比較される。本方法は、次に続くピークを見つけ、次に続くピークのための非線形フィットを用意するために繰り返される。このプロセスは、残差値が一定の所定の残差値より低くなるまで繰り返され、ピークが識別され、それらのために非線形フィットが提供される。一実施例では、計算されたRMSが所定のRMSより大きい場合は、もう1つのピークがフィットされ、ピークをフィットした後に、RMSが所定のRMSより小さいか又はそれに等しい場合は、ピークの数は、RMS値でフィットされたピークの数以上である。 他の実施例では、RMS閾値が設定されていない場合は、ピークの数は、RMS値でフィットされたピークの数以上である。任意の非線形フィットのRMS値がノイズの標準偏差かそれ以上であると仮定すると、所定のRMS値は、データの比較的平らな(線形の)部分にわたる標準偏差を推定することにより選択し得る。一実施例では、計算されたRMS誤差は、所定のRMS値より比較的大きくてよい(スケーリング係数>1)が、あまり理想的でないフィットが受け入れられてよいほど大きくはない。所定のRMS値は、熱量測定データために最も近い非線形フィットを用意することができるようにし、同時に、熱量測定データに関する所望しないピークの不必要な推量を回避する。ピークの必要とされる数がすでに発見されている場合は、所定のRMS値はアルゴリズムが幾つかのピークを探索しないようにする。 所定のRMS誤差値は、ユーザーによって決定してもよい。代替として、所定のRMSは、DSC結果のタイプに応じてシステムによって選択してもよい。 幾つかの実施形態では、このアルゴリズムは、それぞれ異なる非線形フィットのためのRMS値を比較し、熱量測定データにおけるピークの総数を決定する。別の実施形態では、ユーザーは、熱量測定データのための最大値の数を入力することができる。図2に例示されているように、計算されたRMS誤差が所定のRMSより大きい場合は、段階24で非線形フィットのために第2のチェックが実行されてよく、それによって、非線形フィットにおけるピークの総数がユーザーによって入力された最大値の数と比較されることが可能である。非線形フィットにおけるピークの数が最大値の数と等しい場合は、この非線形フィットが選択してもよい。熱量測定データにおいて2以上の非線形フィットをフィットしようと試みる実施形態では、最小RMS誤差を有する非線形フィットが選択してもよい(段階26)。次いで、最小RMS値を有する非線形フィットが確認され(段階22)、それに続いて表示してもよい(段階28)。しかし、非線形フィットにおけるピークの数が最大値の数と等しくない場合は、例えばピークの数が最大値の数より少ない場合は、熱量測定データにおいて次のピークが判定してもよい(段階30)。段階32で、非線形フィットが次の最大値のために提供される。非線形フィットは、前のピーク、すなわち大域最大値のための非線形フィットを保持しながら、次の最大値のために提供される。次に、段階10、14、16、18及び20が繰り返されてよく、それによって、RMS誤差が計算され、RMS誤差が所定のRMS値と等しくなるか又はそれより小さくなるまで、所定のRMS値と比較される。適宜、ピークの数は、全ての非線形フィットが確認された後にシステムにおいて更新してもよい。非線形フィットは、前の識別されたピーク位置及び形状を保持しながら、次の最大残差に対応する位置のためにピークをフィットするように修正される。 本方法はまた、所定のピークのためのピーク位置を登録する段階を含んでいてもよい。本方法は、DSCサンプルにおける不純物が原因で導入されたピークを識別する段階をさらに含んでよい。一実施形態では、フィットされたピークが熱量測定結果の既存のライブラリと比較してもよい。この比較は、サンプルにおける不純物が原因で導入された可能性がある結果を識別するために使用してもよい。一実施例では、通常、サンプルにおける不純物の存在が原因で発生する異常に急峻なピークを識別し廃棄するために、システムにインテリジェンスが組み込まれていてよい。他の実施例では、そのような不明確さ(急峻なピーク)は、システムに予め提供されていてよい。不明確さに関する予め提供された情報は、熱量測定結果に関する訂正された情報をユーザーに提供するために使用してもよい。 適宜、熱量測定データに関する情報がユーザーに提供される。データは、プロセスにおける様々な段階において提供してもよい。代替として、又は追加として、最終結果は、熱量測定ピークの数及び位置のテキスト表現並びにグラフィカル表現を含んでいてもよい。報告は、多数のやり方で、例えば、ビジュアル表示端末、用紙へのプリントアウトを介して、又は、間接的に、例えば、ユーザーが後ほど取り出すために記憶媒体上のデータベースにパラメーター情報を出力することにより、実行してもよい。報告する段階は、テキスト情報若しくはグラフィカル情報、又はそれらの両方を報告する段階を含んでいてもよい。パラメーターは、これらをディスプレイ上に表示すること、又はパラメーターのプリントアウトを生成することによりユーザーに提供してもよい。本発明の幾つかの方法は、モデルスペクトルパラメーターから、サンプルの物理的機能若しくは動作状態又は動作パラメーターに関する若しくは関すると推量される情報を抽出し、そのような情報をユーザーに報告する動作をさらに含んでよい。ピークパラメーター(例えば、ピーク位置)をデータベースと比較し、1以上のピークのための熱量測定結果及びそれらの対応する温度及び時間をユーザーに報告する追加の段階が実行されてもよい。 図3は、本発明の方法の一実施例を例示する。曲線34によって表された熱量測定データが提供される。非線形フィット36が大域最大値のために提供される。大域最大値38が識別される。RMS誤差が計算され、RMS誤差に基づいて、適切な非線形フィットが大域最大値のために提供される。続いて、2以上のピークが存在する場合は、次に続くピークは、反復を使用して非線形的にフィットされる。図4に例示されているように、最小RMS誤差が2つのピークのために発生する。RMS値は1つ及び3つのピークをフィットするためにより高く、RMS誤差の値はピークの数が2つを超えて増大するにつれて増大する。図3に戻って参照すると、第2のピークは人間の目に容易に見えないが、本発明の方法を使用すると、ピークの数は2つとして正しく識別される。 本発明の方法は、DSCが使用される様々な用途において適用してもよい。例えば、本方法は、液晶、或いは安定性、及び/又は酸化のための材料若しくは化合物のための最適記憶条件を研究するために使用してもよい。一実施例では、発熱事象の存在が、加熱するべき物質の安定性を評価するために使用してもよい。本方法は、薬品産業及びポリマー産業において薬品分析のために、又は、ポリマー特性の微調整を可能にする硬化工程を研究するために使用してもよい。硬化工程において発生するポリマー分子の架橋は発熱性であり、その結果として、通常、ガラス転移のすぐ後に現れるDSC曲線において正のピークが生じる。薬品産業では、処理パラメーターを定義するために、薬品化合物をはっきり特徴づけておくことが望ましい。例えば、薬品をアモルファス形態で配送することが必要とされる場合は、結晶化が発生し得る温度で薬品を処理することが望ましい。化合物の混合物が融解する温度範囲は、それらの相対的な量に依存する。その結果として、あまり純粋でない化合物は、純粋な化合物より低い温度から始まる広がった融解ピークを示す。化学分析では、本方法は、サンプルの純度レベルを評価するための分析ツールとして使用してもよい。 本方法は、ハードウェアに対する修正なしで既存のソフトウェアアーキテクチャにおいて実施されることが可能である。したがって、商品のコストを追加することなく、より信頼性が高く、より生産性が高い熱量計を製作することができる。 本明細書では本発明の幾つかの特徴しか例示され説明されていないが、多くの修正及び変更が当業者には思いつかれるであろう。したがって、添付の特許請求の範囲は、本発明の範囲内に入るような修正及び変更を全て含むものとすることを理解されたい。 1組の熱量測定データにおける1以上の熱量測定ピークの位置を自動的に決定する方法であって、a)熱量測定データに対する非線形フィットを用意する段階、b)熱量測定データから非線形フィットを減じて残差を計算する段階、c)残差に基づいて誤差を計算する段階、d)誤差を所定の誤差と比較する段階、及びe)誤差が所定の誤差よりも大きいときは、別の非線形フィットを用意する段階を含む方法。 モルエントロピー変化又は熱量測定データが占める面積を計算する段階をさらに含む、請求項1記載の方法。 計算された誤差に基づいて熱量測定データに別のピークが存在するか否かを判定する段階をさらに含む、請求項1又は請求項2記載の方法。 誤差を計算する段階は、二乗平均平方根誤差を計算する段階を含む、請求項1乃至請求項3のいずれか1項記載の方法。 熱量測定データ上の最大残差の位置を判定する段階をさらに含む、請求項1乃至請求項4のいずれか1項記載の方法。 最大残差位置を熱量測定データのライブラリと自動的に比較する段階をさらに含む、請求項5記載の方法。 熱量測定データのライブラリとの比較に基づいてデータを受け入れる又は拒否する段階を含む、請求項6記載の方法。 最大残差の位置を登録する段階をさらに含む、請求項1乃至請求項7のいずれか1項記載の方法。 関連物理現象を表示する段階をさらに含む、請求項8記載の方法。 ピークの所定の数を入力する段階を含む、請求項1乃至請求項9のいずれか1項記載の方法。 非線形フィットは、多項式フィット、又はレーベンバーグ−マルカート法を含む、請求項1乃至請求項10のいずれか1項記載の方法。 予め定義した段階において非線形フィットを表示する段階をさらに含む、請求項1乃至請求項11のいずれか1項記載の方法。 段階b)、c)、d)及びe)を繰り返す段階をさらに含む、請求項1乃至請求項12のいずれか1項記載の方法。 熱量測定データにおけるピークの数を判定する段階をさらに含む、請求項1乃至請求項13のいずれか1項記載の方法。 1組の熱量測定データにおける1以上の熱量測定ピークの位置を自動的に決定する方法であって、a)熱量測定データに対する第1の非線形フィットを用意する段階、b)熱量測定データから第1の非線形フィットを減じて第1の残差を判定する段階、c)第1の残差に基づいて第1の誤差を計算する段階、d)熱量測定データに対する第2の非線形フィットを用意する段階、e)熱量測定データから第2の非線形フィットを減じて第2の残差を判定する段階、f)第2の残差に基づいて第2の誤差を計算する段階、g)第1の誤差と第2の誤差を比較する段階、及びh)誤差が小さい方の非線形フィットを選択する段階を含む方法。 選択された非線形フィットが最小誤差を準備するか否かを確認するために1以上の追加の非線形フィットを有する段階d)からh)までを繰り返す段階をさらに含む、請求項15記載の方法。 第1の誤差又は第2の誤差が所定の値より小さいか否かをユーザーに通知する段階をさらに含む、請求項15又は請求項16記載の方法。 所定の値より小さい誤差を有する非線形フィットを自動的に選択する段階をさらに含む、請求項17記載の方法。 請求項1乃至請求項18のいずれか1項記載の方法を実施することを含むタンパク質の熱分析であって、請求項1記載の非線形フィット、又は請求項15記載の第1の非線形フィット若しくは第2の非線形フィットは、下記の式1、2又は3のいずれか1以上によって判定される、熱分析。式中、B0、B1は定数であり、添字Aはタンパク質がアンフォールディングし得るドメインを示し、Tは温度であり、TmAはタンパク質の50%がドメインAにおいてアンフォールディングした温度であり、Cpはモル熱容量であり、ΔCpはモル熱容量の変化であり、KAはドメインAの平衡定数であり、ΔHAはドメインAのモル熱エンタルピーの変化であり、ΔCpAはドメインAのモル熱容量の変化であり、ΔHmAは温度TmAでのドメインAのモル熱エンタルピーの変化である。 一実施形態では、1組の熱量測定データにおける1以上の熱量測定ピークの位置を自動的に決定する方法を提供する。本方法は、a)熱量測定データに対する非線形フィットを用意する段階、b)熱量測定データから非線形フィットを減じて残差を計算する段階、c)残差に基づいて誤差を計算する段階、d)誤差を所定の誤差と比較する段階、及びe)誤差が所定の誤差よりも大きいときは、別の非線形フィットを用意する段階を含む。【選択図】 図1


ページのトップへ戻る

生命科学データベース横断検索へ戻る