<道行くひとがー>
「これは何ですか、珍しいですね」と濃紫のフリージャを見た通りすがりのひとが声を掛けて下さいました。
おかげで、このフリージャが有りそうで無さそうな花であることを知りました。
結婚した頃、夫の実家から送られてきた食料の中にあった球根が増えたのです。
幾年も、稀有なる花とは気が付かず、本当に御見逸れ御免、です~
それにしても昨今の花屋さんのフリージャは、この濃紫は無いものの、白、黄、ショッキングピンク、薄紫、オレンジ、トルコグリーン、そして花びらの大小、白の混じり、なんとヴァラエテイなのでしょう!
<遺伝学と統計学>
遺伝子組み換え技術を得た現在でも、花色や穀物の品種改良はやはり昔からの交配による育種法が行われていますね。
掛け合わせ、と言えばメンデル(1822-1884、オーストリア)でしょうか。
メンデルは若い頃数学を学んだものの、教師の試験に何としてもパスできませんでした、が修道院に勤めて、裏庭で花の色、豆の形をマークに膨大な数のえんどう豆の掛け合わせを行いその結果を数値化することによって、遂に遺伝因子の存在を導きました。
その頃、ダーウイン(1809-1882、英国)が「環境に適したものが子孫を残す上で有利となる」という考えを主張し「進化は偶然が支配する変化である」と論著して社会を揺るがしていました。
そのダーウインもやはり古来の「カエルの子はカエル」という遺伝のしくみを、また表現形質の優劣のしくみを明らかにしたく植物やハトを使って猛烈に掛け合わせ実験をしていたのでした。
しかし、メンデルの数理統計のセンス、これこそがダーウインも至れなかった、遺伝の法則という大発見を後世に知らしめることを可能としたのです。
<エクセル統計分析、平均値、中央値、ガウス分布>
生物学や工学実験の結果のみならず、ビジネスの世界でも需要の予測、物の販売、試作品開発などにおいて、データ解析が次のステップへの根幹となります。
ところで新聞、雑誌など日本人が記したものではもっぱら平均値しか見ませんが欧米人は中央値を上手く使って説明しているのを見ます。
経済統計などはガウス(正規)分布に従わないことが多いので中央値のほうがデータの特性が得やすいのです。
平均値には極端な値(外れ値)の影響を強く受ける、ということがあります。
平均値を用いる場合は、その集団が正規分布をしていることが、絶対的な前提条件になります。
データの数が多ければ正規分布にかなり近づくはずですが、例えば、貯蓄額では数千万人が対象でも、一握りの金持ちが握り締めているので正規分布になりません。
中央値ならその値よりも大きい特性値を持つ人が全体の半分、小さい特性値を持つ人が半分という直感的に明確な意味を与えます。
ですからデータの分布に偏りや極端な数値がある場合は中央値が良さそうです。
エクセルの分析ツールを使うと統計分析の基本値が即座に表(図、基本統計量)になります。
ヒストグラムはデータの散らばり具合を視覚的に示します。
図には、私がストップウオッチで10秒を30回測定したときの結果を、分析ツールの中のヒストグラムを選択して入力、区切り幅を指定して書かせました。
昔、60秒インターバルで泳ぎこんでいた私は身体が秒刻みを記憶しているかのようにバラツキ(分散や標準偏差値)は極めて小さいものでしたがーー
今回測定のエクセルの計算結果は、平均値(9.74), 中央値(9.80), 分散(0.358), 標準偏差(0.599)などでした。
その昔、放物線やだ円などの曲線が数式で表せることを知り感激しました。
美しい曲線と言えばヴィーナスのライン、いえ正規分布曲線!!
正規分布曲線は平均値と標準偏差から求められ、エクセルの中の関数NORMDISTを使ってヒストグラムと重ねて表わすことが出来ます(図)。
手書き計算に比べ、エクセルは手間いらずで余りにexcellent!エクセルも只モノでない気がしてきます~
正規分布は臨床検査だけに留まらず最も広く用いられる分布モデルです。
健常者の多くの検査値は正規分布に近いため、そこでさまざまな検査値について平均値と標準偏差値を算出して、平均値±2標準偏差(95%が含まれる)を正常範囲とします。
ですから確率的には健常者が20種類の検査を受けるとどれか一つが正常範囲を外れることになりますね。
<先行き不透明な社会でこそ確率と統計が必要?>
この世のことは、独立でない事象が絡み合って混沌、曖昧模糊としているように感じます。
その曖昧さにつけこまれないようにするには、評価、納得できるシステム作りが大切ですね。
統計解析の検定法を用いれば、正しさ具合が推察出来ます。
今回の放射能汚染に関しては、いろいろな数字に一鬼?一憂しました。
データがどのように採取され、どのように解析されたのかが重要なのです。
私達の健康は、来たる遺伝子医療社会で個人レベルで解決されていくでしょう。
そのためには、メンデルやダーウインの苦労をはるかに超えて、個人のSNP(
2月、本ブログ)データや臨床データを数値化し、確率的に効果のある情報処理科学に基づいた医療を進めていかなければなりません。