2012年06月30日
エクセル、FTEST,FDIST,FINVのFってナ~ニ!
<要因が複数ある時の統計解析はーー>
FTESTのFはF検定のFジャン~
というだけではないのです。
Fは統計学の父、フィッシャー(1890-1962,英)のFです。
数学と生物学を学んだフィシャーは、ロンドン郊外の農事試験場に就職しました。
広大な敷地にある質や環境が異なる畑では同じ植物でも生育が異なり、肥料の効果もはっきり攫めません。要因が沢山あって答えが出せないのです。
さてt-検定を使えば、2群の平均値に差があるといえるか、という検定はできます(本ブログ)。
そこでフィシャーはそれを広げて複数のグループ間の要因に違いがあるかどうか調べられないか、と探求しました。
そして群間分散/郡内分散を調べて群間に差があることが有意かどうか、がわかる検定法を発見しました。分散分析(ANOVA)です。
データが左上の表のような場合は、エクセルの分析ツールの「二元配置のくり返しのない分散分析」を選びます。
次にデータを囲んで分散分析表を得ます。
有意水準を5%とするならその表のP値から、各畑においては有意に、状態の違いがある、と言えることがわかるのです。
すなわち分散分析は分散の比の検定を行って要因によっておこる変動が誤差内かどうかを調べているのです。
復習となりますがt-検定には3種類あってどれを使うかは、まずF検定を行うことによって、与えられた二群のデータが等分散か不等分散かを決めました。それから分析ツールの中の適切なt-検定を選択して解析しました。
正規分布では確率密度曲線を描くのにNORMDISTの関数値を使いました(本ブログ)。また、t-検定ではTTESTの関数式よりP値を得ました。
さてF検定でもエクセルに関数が揃っています。
FTEST(両側確率P)やFDIST(片側確率P)、FINVという関数を使ってF分布上のP値やF値が求められます。
このF分布という分散比の確率分布を用いたF検定と分散分析の発見こそフィッシャーの偉業とされているものです。
<F分布の確率密度曲線>
ところでF分布という確率分布は正規分布(本ブログ)やt-分布(本ブログ)の確率分布と違ってそのグラフは自由度によって大きく変わり左右対称でないのが特徴です。
その確率密度を出す関数式がエクセルではアドインされていません。
そこで私はNTFDISTという関数をエクセルに組み込みました。
ここでは自由度が3と4、3と10の値を使ってNTFDIST関数による2種類の確率密度の値を出しました。そして散布図をクリックしてF分布のグラフを作成しました(図の右上)。
<品質管理と分散分析>
分散分析は育種や研究開発などにおける実験結果の分析のみではありません。
「世界一の品質を持つ日本!」と言われるように日本製品における品質管理では統計学が力を発揮しています。
統計的品質管理に卓越するには、数々の要因の中から品質に影響をおよぼす異常原因を統計学的に見つけ出す、そしてきちんと対処する、これに尽きますね。
このように分散分析は統計的現象の原因究明やグループ間の要因解析ができるので複数の患者への薬の効果を調べる場合にもうってつけです。
要因がひとつである一元配置の分散分析の例としては、結核菌の再来を抑えるべくしてなされた下記のようなスクリーニングの研究報告があります。
<多剤耐性結核菌を撲滅するには>
先日も結核菌集団罹患のニュースがありました。
日本は先進国の中でとても結核罹患率が高いのです。
なぜこの現代に結核菌に脅かされるのでしょう。
戦後、結核は日本の死亡原因の第一位でしたが化学薬品のお陰で非常に減りました。
ところが中途半端な化学療法によって耐性結核菌が生じてしまったのです。対処に困難を極めています。
南アフリカでは結核やHIVに効くとされる植物由来の民間薬が沢山あるそうです。しかしその科学的な検証はなされていません。
論文では21種類のうち4つの植物で結核菌と薬剤耐性菌の増殖を抑えることが解析されました(参考)。
成分の抽出とさらなるバイオアッセイを進めて薬剤耐性菌に効く天然の成分が分かると良いですね。
なにはともあれ結核菌に冒されても薬効が得られて死なずに済むように、薬の併用や免疫力の低下を個人のレベルで防いでおくことが大切です。
日々の健康管理に勝るものは無し、です~
FTESTのFはF検定のFジャン~
というだけではないのです。
Fは統計学の父、フィッシャー(1890-1962,英)のFです。
数学と生物学を学んだフィシャーは、ロンドン郊外の農事試験場に就職しました。
広大な敷地にある質や環境が異なる畑では同じ植物でも生育が異なり、肥料の効果もはっきり攫めません。要因が沢山あって答えが出せないのです。
さてt-検定を使えば、2群の平均値に差があるといえるか、という検定はできます(本ブログ)。
そこでフィシャーはそれを広げて複数のグループ間の要因に違いがあるかどうか調べられないか、と探求しました。
そして群間分散/郡内分散を調べて群間に差があることが有意かどうか、がわかる検定法を発見しました。分散分析(ANOVA)です。
データが左上の表のような場合は、エクセルの分析ツールの「二元配置のくり返しのない分散分析」を選びます。
次にデータを囲んで分散分析表を得ます。
有意水準を5%とするならその表のP値から、各畑においては有意に、状態の違いがある、と言えることがわかるのです。
すなわち分散分析は分散の比の検定を行って要因によっておこる変動が誤差内かどうかを調べているのです。
復習となりますがt-検定には3種類あってどれを使うかは、まずF検定を行うことによって、与えられた二群のデータが等分散か不等分散かを決めました。それから分析ツールの中の適切なt-検定を選択して解析しました。
正規分布では確率密度曲線を描くのにNORMDISTの関数値を使いました(本ブログ)。また、t-検定ではTTESTの関数式よりP値を得ました。
さてF検定でもエクセルに関数が揃っています。
FTEST(両側確率P)やFDIST(片側確率P)、FINVという関数を使ってF分布上のP値やF値が求められます。
このF分布という分散比の確率分布を用いたF検定と分散分析の発見こそフィッシャーの偉業とされているものです。
<F分布の確率密度曲線>
ところでF分布という確率分布は正規分布(本ブログ)やt-分布(本ブログ)の確率分布と違ってそのグラフは自由度によって大きく変わり左右対称でないのが特徴です。
その確率密度を出す関数式がエクセルではアドインされていません。
そこで私はNTFDISTという関数をエクセルに組み込みました。
ここでは自由度が3と4、3と10の値を使ってNTFDIST関数による2種類の確率密度の値を出しました。そして散布図をクリックしてF分布のグラフを作成しました(図の右上)。
<品質管理と分散分析>
分散分析は育種や研究開発などにおける実験結果の分析のみではありません。
「世界一の品質を持つ日本!」と言われるように日本製品における品質管理では統計学が力を発揮しています。
統計的品質管理に卓越するには、数々の要因の中から品質に影響をおよぼす異常原因を統計学的に見つけ出す、そしてきちんと対処する、これに尽きますね。
このように分散分析は統計的現象の原因究明やグループ間の要因解析ができるので複数の患者への薬の効果を調べる場合にもうってつけです。
要因がひとつである一元配置の分散分析の例としては、結核菌の再来を抑えるべくしてなされた下記のようなスクリーニングの研究報告があります。
<多剤耐性結核菌を撲滅するには>
先日も結核菌集団罹患のニュースがありました。
日本は先進国の中でとても結核罹患率が高いのです。
なぜこの現代に結核菌に脅かされるのでしょう。
戦後、結核は日本の死亡原因の第一位でしたが化学薬品のお陰で非常に減りました。
ところが中途半端な化学療法によって耐性結核菌が生じてしまったのです。対処に困難を極めています。
南アフリカでは結核やHIVに効くとされる植物由来の民間薬が沢山あるそうです。しかしその科学的な検証はなされていません。
論文では21種類のうち4つの植物で結核菌と薬剤耐性菌の増殖を抑えることが解析されました(参考)。
成分の抽出とさらなるバイオアッセイを進めて薬剤耐性菌に効く天然の成分が分かると良いですね。
なにはともあれ結核菌に冒されても薬効が得られて死なずに済むように、薬の併用や免疫力の低下を個人のレベルで防いでおくことが大切です。
日々の健康管理に勝るものは無し、です~
2012年06月10日
健康の分子マーカー探索に新兵器!!
<大海の砂粒を探す術はーー>
健康の分子指標は大海の砂粒の如し、です(図、左上)。
しかし計測技術を高め個人の測定値を得て、そのデータを管理・情報化していけばきっと健康長寿がもたらされます・・・・
ドイツのミュンヘン大学において超微量で瞬時に生体成分の結合反応速度論的解析が出来る器械が開発されました。
温度泳動的生体分子間相互作用解析装置(MST)です。
これまで生体成分の検出法としてはELISA法やSPR法が汎用されています。
ELISA法では検出したい分子に結合する分子を固相化しておき目的分子を結合させてからさらに標識をつけた別の結合分子と反応させます。標識の酵素活性や光学的性質を用いて測定値を得ます(図の右)。しかしそのためには結合後にB/F分離という未結合の成分を良く洗う操作が必要です。
SPRセンサーもチップ上で生体成分と親和性を持つ分子を固相結合させます。この場合は標識分子を使う必要がなく、複合体生成で増大した質量によって生じるプラズモンの変化を電光的に検出します(図の右)。数千万円、と高価です。
MST法による検出は原理が全く異なります(図の左下)。
多成分混合系において局所的にわずかの温度を上げることによってできる温度依存的な濃度勾配による蛍光標識分子の蛍光強度の変化から分子動力学計算をします。
その開発者は社長でもあるミュンヘン大学のDuhr博士です。
分子の温度泳動理論に基づいて核酸の構造安定性の解析や生体成分の検出の応用研究に邁進されています。
MST法ではより生体内に近い状態とすべく、上の二つの装置とは異なりキャピラリーの溶液中で結合反応を行います。
キャピラリー(径、0.1 mm)の反応溶液量は~250 nlで米粒の百分の一の量もいらないようです。そして測定時間といえば一分以内という迅速さです。
本体はパソコンサイズです。
さらに素晴らしいのがソフトウエアです。16本のキャピラリーに同時にサンプリングして一気にキネティクスの値が得られるのです。
日本にはまだ一台、1500万円とのことです。
<なぜバイオマーカーの発見が難しいのか>
どんなセンシング技術がバイオマーカーの発見をもたらすのでしょうか。
ゲノム塩基配列は生物を構成する蛋白質やRNAの設計図です。
ところが遺伝子から読み取られる各個人の蛋白質は遺伝子の突然変異やSNP(本ブログ )のためにまた後天的なDNAの修飾(本ブログ )によってその発現のレベルや分子構造が多様に変わり得ます。
またアルツハイマー病やうつ病でおきるという蛋白質のプロセシング異常では蛋白質の大きさが違ってきます。
これらの変化は当然、相互作用する分子の相手や結合の親和性などが変わり代謝異常や疾患の原因となります。
例えば酸化ストレスによる酵素の修飾による構造的変化とそれがもたらす結合パートナーの選択の変化は細胞の生死に関わるシグナル伝達を大きく変貌することが生化学的に示されました(本ブログ)。
確かにこのような生化学的な解析技術はナノの世界(本ブログ)を超えつつありますがその工程の複雑さのために生化学者でも並みの技と時間ではなし得ません。
そこで期待するのが準備や操作がシンプルでかつ分子間の解離定数を数分で検出してくれるこのMST法なのです。
<キネティクスで疾患の解明>
自分の血液中に自己抗体が出来てしまう難病は重症筋無力症や全身性エリテマトーデスなど多く知られています。
Lippok らは自己抗体疾患であり心臓の病気である拡張型心筋症についてMST法を用いました。
拡張型心筋症ではβ1アドレナージック受容体に対する自己抗体が血清中に増えてしまい、それが細胞外の受容体部分に結合してしまうので心筋細胞内へのシグナル伝達情報が過多となり心臓が障害されてしまいます。
そこで彼らはβ1アドレナージック受容体の細胞外アミノ酸配列部(COR1)を合成して標識分子として、まず健常なヒト血清中の自己抗体について解析しました。(参考)。
ヒト血液中には抗体分子である種々のイムノグロブリンが高濃度に存在しています。ですからクルードなサンプルでダイレクトに解析できたことは極めて快挙です。創薬の開発にも貢献するでしょう。
この研究結果は自己抗体が約100 nMと検出されたので、血中IgGが10 mg/mlとすると1000分の1くらい、この自己抗体があることになりますね。患者サンプルとの比較の解析結果が待たれます。
私たちが測りたい分子(図、左上)はストレスや環境の変化に応答しやすく、その測定値は個人の状況の違いによっても変動が大きいでしょう。
従って、どんなサンプルにも対応出来、広いレンジ幅で測定出来る、そしてキネティクスの値が即座に得られる、というMSTの測定法はホープとなりそうです。
健康の分子指標は大海の砂粒の如し、です(図、左上)。
しかし計測技術を高め個人の測定値を得て、そのデータを管理・情報化していけばきっと健康長寿がもたらされます・・・・
ドイツのミュンヘン大学において超微量で瞬時に生体成分の結合反応速度論的解析が出来る器械が開発されました。
温度泳動的生体分子間相互作用解析装置(MST)です。
これまで生体成分の検出法としてはELISA法やSPR法が汎用されています。
ELISA法では検出したい分子に結合する分子を固相化しておき目的分子を結合させてからさらに標識をつけた別の結合分子と反応させます。標識の酵素活性や光学的性質を用いて測定値を得ます(図の右)。しかしそのためには結合後にB/F分離という未結合の成分を良く洗う操作が必要です。
SPRセンサーもチップ上で生体成分と親和性を持つ分子を固相結合させます。この場合は標識分子を使う必要がなく、複合体生成で増大した質量によって生じるプラズモンの変化を電光的に検出します(図の右)。数千万円、と高価です。
MST法による検出は原理が全く異なります(図の左下)。
多成分混合系において局所的にわずかの温度を上げることによってできる温度依存的な濃度勾配による蛍光標識分子の蛍光強度の変化から分子動力学計算をします。
その開発者は社長でもあるミュンヘン大学のDuhr博士です。
分子の温度泳動理論に基づいて核酸の構造安定性の解析や生体成分の検出の応用研究に邁進されています。
MST法ではより生体内に近い状態とすべく、上の二つの装置とは異なりキャピラリーの溶液中で結合反応を行います。
キャピラリー(径、0.1 mm)の反応溶液量は~250 nlで米粒の百分の一の量もいらないようです。そして測定時間といえば一分以内という迅速さです。
本体はパソコンサイズです。
さらに素晴らしいのがソフトウエアです。16本のキャピラリーに同時にサンプリングして一気にキネティクスの値が得られるのです。
日本にはまだ一台、1500万円とのことです。
<なぜバイオマーカーの発見が難しいのか>
どんなセンシング技術がバイオマーカーの発見をもたらすのでしょうか。
ゲノム塩基配列は生物を構成する蛋白質やRNAの設計図です。
ところが遺伝子から読み取られる各個人の蛋白質は遺伝子の突然変異やSNP(本ブログ )のためにまた後天的なDNAの修飾(本ブログ )によってその発現のレベルや分子構造が多様に変わり得ます。
またアルツハイマー病やうつ病でおきるという蛋白質のプロセシング異常では蛋白質の大きさが違ってきます。
これらの変化は当然、相互作用する分子の相手や結合の親和性などが変わり代謝異常や疾患の原因となります。
例えば酸化ストレスによる酵素の修飾による構造的変化とそれがもたらす結合パートナーの選択の変化は細胞の生死に関わるシグナル伝達を大きく変貌することが生化学的に示されました(本ブログ)。
確かにこのような生化学的な解析技術はナノの世界(本ブログ)を超えつつありますがその工程の複雑さのために生化学者でも並みの技と時間ではなし得ません。
そこで期待するのが準備や操作がシンプルでかつ分子間の解離定数を数分で検出してくれるこのMST法なのです。
<キネティクスで疾患の解明>
自分の血液中に自己抗体が出来てしまう難病は重症筋無力症や全身性エリテマトーデスなど多く知られています。
Lippok らは自己抗体疾患であり心臓の病気である拡張型心筋症についてMST法を用いました。
拡張型心筋症ではβ1アドレナージック受容体に対する自己抗体が血清中に増えてしまい、それが細胞外の受容体部分に結合してしまうので心筋細胞内へのシグナル伝達情報が過多となり心臓が障害されてしまいます。
そこで彼らはβ1アドレナージック受容体の細胞外アミノ酸配列部(COR1)を合成して標識分子として、まず健常なヒト血清中の自己抗体について解析しました。(参考)。
ヒト血液中には抗体分子である種々のイムノグロブリンが高濃度に存在しています。ですからクルードなサンプルでダイレクトに解析できたことは極めて快挙です。創薬の開発にも貢献するでしょう。
この研究結果は自己抗体が約100 nMと検出されたので、血中IgGが10 mg/mlとすると1000分の1くらい、この自己抗体があることになりますね。患者サンプルとの比較の解析結果が待たれます。
私たちが測りたい分子(図、左上)はストレスや環境の変化に応答しやすく、その測定値は個人の状況の違いによっても変動が大きいでしょう。
従って、どんなサンプルにも対応出来、広いレンジ幅で測定出来る、そしてキネティクスの値が即座に得られる、というMSTの測定法はホープとなりそうです。