信頼性工学ノート


PSyQ

1. 信頼性とは

  • 1-1. 信頼性の起こり
  • 1-2. 信頼性技術と品質管理
  • 1-3. 信頼性とは

1-1. 信頼性の起こり

 人類が信頼性を目覚めるきっかけは、1本の真空管でした。真空管が信頼性という概念を誕生させる動機の1つであったことは事実のようです。

 第二次世界大戦中、アメリカは大量の軍用機を極東に配置していました。使用目的が日本に対する攻撃であったのは遺憾ですが、幸か不幸かそれらの軍用機が半分以上使いものになりませんでした。調べてみると、飛行機の航法や通信などに使われている電気機器が半分以上も故障しているし、予備品でさえ半分は故障しているという始末でした。そしてそのほとんどは真空管の故障でした。

 これはアメリカ軍にとってはもちろん、アメリカ政府にとってもゆゆしい問題です。さらに、艦船用の電気機器も正常に作動するほうが少ないことも判明しました。そして、軍と産業界が一体となって対策が検討されはじめたのです。

 まず、真空管が図面どうりに正しく作られるようにと製造過程に対する管理を厳しく、徹底的な検査が行われました。

 一方、苛烈な戦争のさなかに故障が続出するアメリカ軍からは、絶対に故障しない機器を作れ、と厳しい要求が出されました。メーカーとしても設計に何を盛り込めば故障しない製品に近づくことができるかと懸命の研究を開始しました。この「なに」が信頼性という概念の起こりです。

 第二次大戦が終わった後、軍が中心になって戦争中の技術活動が生んだ膨大な資料の整理にかかりました。中でも将兵を悩ませた電子兵器の故障に関するデータは、改めて信頼性に関する問題意識を駆り立てずには起きませんでした。こうして1950年に電気機器の信頼性を調査する委員会が軍や民間の専門家を集めて発足し、全面的な調査研究が開始されました。

 折しも朝鮮戦争(1950〜1953年)が勃発し、ジェット戦闘機がはじめて本格的に使用されはじめたのですが、電子機器の故障に起因すると思われる事故が多発し、せっかくの戦闘機が数多く失われました。これが議会で取り上げられ政治問題化したため、信頼性についての調査研究がいっそう加速されました。そして、前記の委員会は電子機器信頼性諮問委員会(通称AGREE*1)に昇格して、1957年には有名なAGREEレポートが提出されました。

 このAGREEレポートは、日本でも初期の信頼性活動に参加した人たちにとってはバイブルのようなものでした。内容は、信頼性に対する定量的な要求の仕方と、信頼性を確認するための試験法であり、アメリカ軍が電子機器を調達する際の方針に画期的な転換をもたらすとともに、日本などに対しても大きな影響を与えました。

 そのころは、米ソのミサイルや宇宙開発の競争時代が目前に迫っていました。ミサイルや宇宙機器の生命は信頼性であり、費用の大部分は信頼性のために費やされるといっても過言ではありません。信頼性の研究にいっそう拍車がかかりました。こうして、1960年前後までに信頼性に関するMIL規格が続々と発行され、現在の整備された信頼性管理体系の基礎ができあがったのでした。

 こうしてアメリカの軍事的な要求から出発した信頼性技術ではありますが、内容的には軍用機器にも民生用の製品にも差別なく有効であることに疑念はありません。信頼性技術は軍用から民生用へと普及し、また、対象も電子機器から他の一般的な製品へと拡大され、さらに、最も信頼性技術を必要とする巨大システムへと応用されて行きました。

1-2. 信頼性技術と品質管理

QC(quality controlの略、品質管理のこと)

 ことの起こりは互換性にあります。近代工業が発達し、製品を大量に作るためには部品どうしの互換性が必須です。つまり、部品の寸法が揃っていなければなりません。そのためには製作誤差を一定の範囲以内になるように管理する必要があります。ここに品質管理の芽生えがあったようです。

TQC(total QC)

信頼性を支える3つの柱

  • 統計確率に基礎をおく信頼性工学
    • 飛行機における双発と4発
    • 直列系と並列(冗長)系
  • 信頼性技術の周辺にある固有技術
    • ソフトウエアの信頼性技術・パリティビット
    • むらのない金属材料の作り方
    • 擦れ合う部分の摩耗の防ぎ方
    • 荷重や応力の集中を避ける方法 など 信頼性工学の使命 信頼性工学の中にはそれ自体が製品の信頼性向上に直接に寄与する手法も含まれています。しかしながら、信頼性工学の使命は、製品の信頼性の現状を正確に把握し、改善の方向を示唆し、その結果を予測し、あるいは保証し、投資効率や危険負担についての判断資料を提供することにあると思われます。
  • マネージメントの重要性
     人間が作り出す製品あるいは人間が運転する機械・装置は、すべて人間が絡んでいる。大きなシステムのほとんどは、システムの構成要素として人間が参加しているマン・マシン・システムです。したがって、製品・機械・装置の信頼性は人間の心理や挙動を除外して語れない。
     船での経験…ブレーカーをロックしたこと、発電機の界磁調整器をさわってブラックアウトしたこと

1-3. 信頼性とは(信頼性の定義)

キーワード
信頼性 信頼度 故障

 約束どおり、あるいは期待どおりに行動すれば「信頼できる」といいます。システムや部品についても同じことです。信頼性(reliability)をJISでは

アイテムが与えられた条件で規定の期間中、要求された機能を果たすことができる性質

と定義しています。

 「アイテム」とは、信頼性の対象となるシステム、サブシステム、機器、装置、構成品、部品、素子、要素の度の総称またはいずれか、のことです。

  「与えられた条件」とは、例えば自動車の場合、サハラ砂漠で使うのと舗装された道路で使うのとが同じ厳しさとは思えないし、また、いつも重量物を積んでいる車と空の車を同列に比較するのは不公平です。そこで、信頼性を論ずる場合はまず条件を決めておこうというわけです。

 「規定の期間中」とは、アイテムの場合、例えば無故障を要求される期間が1日と1年では全く厳しさが異なります。そこで、信頼性について語るときには「期間」を決めておく必要があります。

 「期間」は、必ずしも時間の経過であるとは限りません。運行距離、使用回数などが適当な場合もあります。

 そして最後に「要求された機能」とありますが、一般的にここがなかなか問題です。人間の場合でも、頑固に決められたことを頑固にやり通すことを期待するのか、臨機応変に処理することを期待するのかによって、各個人の信頼性はだいぶ異なります。信頼性を要求あるいはするとき、評価するとき、何が要求されている機能かを峻別しておく必要があります。

 信頼性と並ぶ用語に信頼度があります。信頼度のJISの定義は、

アイテムが与えられた条件で規定の期間中、要求された機能を果たす確率

となっています。最後の文章が

  • 信頼性:〜果たすことができる性質
  • 信頼度:〜果たす確率

となっている以外は、信頼性と信頼度の定義は全く同じです。英語では、信頼性も信頼度も、同じくreliabilityです。つまり信頼性の方は文字どおりアイテムのもつ性質を意味しており、信頼度の方は、その性質を確率という数値を使って定量的に表現しています。

 信頼性の方は、「性質」ですから、その程度を表現するには、低い、高い、非常に高い、などの文学的な表現ですみますが、信頼度の方は「確率」ですから、0.95(あるいは95%)というような数値で表します。信頼性工学が工学である以上、数値で表します。

 ところで、JISでは故障(failure)を

アイテムが規定の機能を失うこと

としています。したがって、信頼度を「アイテムが与えられた条件で規定の期間中、故障しない確率」と言い換えてもいいでしょう。一般に故障する確率をFとすると、故障しない確率すなわち信頼度Rは

R = 1 - F; // 式1

で表されます。

コラム1 確率

 ラプラスは確率を次のように定義している。

 ある試みをしたとき、起こりうるケースの数がN個であって、そのN個のケースは、全く同じ可能性で起こりうるものと信ずることができるとする。このN個のケースの内、R個が、われわれの期待することがらを満足するとき、そのことがらの起こる確率を

であると、定義する。

 例えば、1組52枚のトランプから1枚を抜き取るという試みをしたとき、起こりうるケースの数Nは52であって、そのうち、「ダイヤである」ということがらの起こる確率は13/52=1/4であると約束したことになる。

 このように定義された確率は、次のような性質をもっている。

  • 期待することがらが全く起こる可能性がないときには、確率は0である。例えば、1組のトランプから1枚のカードを取り出したとき花札のでる確率は0/52=0である。
  • 期待する確率が必ず起こるなら、確率は1である。1組のトランプから1枚のカードを取り出してそれがトランプである確率は52/52=1である。
  • 確率は必ず0〜1までの間の値であって、1より大きい値になったり、マイナスになったりしない。

2. 故障のパターン

  • 2-1. 人間の死亡率 〜 故障のパターンを知るために
  • 2-2. バスタブ曲線
  • 2-3. 故障の起こり方と保全

2-1. 人間の死亡率 〜 故障のパターンを知るために

キーワード
生存者数 死亡者数 死亡者累計 死亡率 ヒストグラムの刻み幅

 この節のテーマは故障の起こり方(パターン)なのですが、説明の都合上、身近な例として人間の寿命について考えてみましょう。同じ日に生まれた100人の新生児が、全員亡くなるまでの約100年にわたって追跡したデータがあると思ってください。

&ref(): The style ref(filename,pagename) is ambiguous and become obsolete. Please try ref(pagename/filename); 表2-1 人間の死亡率(100人のデータ)

 そのデータは、表2-1のとおりです。0〜9歳の期間では当初100人の生存者がいて、その期間中に5人が死亡し、10〜19歳の期間については当初95人の生存者の内期間中に1人が死亡、そして、90歳のときには4人が生存していたけれど99歳までの間に4人とも天か地に還って追跡調査が終了した、というのがこの表のストーリーです。

 死亡者数の欄をみてください。0〜9歳の期間に5人もの方がなくなっています。医学の進んだ現在でも出産は母親にとっても赤ちゃんにとっても命を賭けた営みであるほか、何らかの先天的な欠陥をもって生まれた赤ちゃんがこの期間に命を落とすことが多いからでしょう。その後、10代、20代、30代と死亡の少ない期間が続きます。40代から徐々に死亡者数が増加し、60代、70代が最も死亡者数が多くなっています。

 その後、80代、90代と急激に死亡者数が減っていますが、これはどういうことでしょう。80代、90代になったら再び元気を取り戻したのでしょうか。いや、そんなことはないでしょう。死ぬべき生存者が少なくなったに過ぎません。

 このように、「死にやすさ」は死亡者数をみただけではわかりません。生存者の内どのくらいの割合で死亡したかを調べる必要があります。それが死亡率です。表より、0〜9歳では100人の内5人が死亡したので5/100=0.05、つまり5%です。10〜19歳では1/95=0.011=1.1%、そして、90〜99歳では4人の内4人死亡したので100%です。0〜9歳を除けば、明らかに高齢化とともに死亡率が上昇しています。

 表2-1を棒グラフにしてみましょう。それが図2-1です。年齢が10歳刻みの幅になっているため、棒グラフの頂上が凸凹しています。この追跡調査では対象人数がわずか100人であったために、1本の棒の中に適当な人数を含ませるために10歳刻みにする必要があったからです。

&ref(): The style ref(filename,pagename) is ambiguous and become obsolete. Please try ref(pagename/filename); 図2-1 人間の死亡率(100人のデータから)

 もし仮に10,000人ものデータがあれば、1歳刻みで棒グラフを描いてもよいでしょう。そうすると棒グラフの頂上の凸凹は小さくなり、1本のなめらかな曲線で連ねても不自然でなくなるでしょう。それで、死亡者数と死亡率の棒グラフの頂をなめらかな曲線でなぞると図2-2のようなグラフになります。

&ref(): The style ref(filename,pagename) is ambiguous and become obsolete. Please try ref(pagename/filename); 図2-2 人間の死亡率

 図2-2の上半分は、死亡者数のグラフで、このグラフの縦軸には目盛がありません。調査対象の人数によって目盛が異なるし、今の場合何人を調査対象にしたかは問題にしていないので、目盛を省略してあります。一般には、図2-2の上図の縦軸を死亡者の割合(正しくは、死亡の密度関数)とし、曲線と縦軸に挟まれた面積が1になるように縦軸の目盛を刻みます。

 問題は、図2-2の下図です。縦軸は死亡率を表していますが、目盛を刻んでいません。目盛については後で触れます。今は上にいくほど死亡率が高い、つまり、死にやすい(故障しやすい)と思ってください。つまり、人間は生まれた直後に死亡率のやや高い時期があり、それを過ぎると最も死亡率の低い安定した期間を迎え、壮年期くらいから徐々に死亡率が上昇しはじめ、その後は老齢化とともに死亡率は上昇の一途をたどるということになります。

2-2. バスタブ曲線

キーワード
故障率 初期故障 偶発故障 摩耗故障 有効寿命

 前節で人間の死亡率の曲線についてみてきましたが、この傾向は人間ばかりではなく他の動物の死亡率についても、また、アイテム(システムや部品の総称)の故障率(failure rate)についても顕著に現れます。その傾向を露骨に描いたのが図2-3です。曲線の形が浴槽(bathtub)に似ていることからバスタブ曲線と呼ばれ、信頼性工学の象徴的な用語の一つになっています。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 図2-3 バスタブ曲線

 図の左側、つまり当初は高い死亡率や故障率が時間の経過につれて急激に低下している期間を仮に第1の期間と呼びましょう。人間の場合には、現代医学のおかげで出産時の危険が大幅に減ったり、多少先天的な欠陥なら治療できるのでこの期間の死亡率はあまり高くありませんが、魚や昆虫などではこの期間の死亡率は非常に高くなります。

 動物ばかりではありません。テレビやパソコンなどの家電製品、自動車、飛行機や船舶などの機械製品も製造直後には故障が多発するのが普通です。そこで、この期間に生ずる故障を初期故障(initial failureまたはearly failure)と呼びます。そして、この初期故障の発生する期間を初期故障期間と呼んでいます。

 たいていの製品には、このような初期故障が起こる期間があります。そこで、メーカーでは出荷前にならし運転などを行って初期故障を起こさせてしまい、不具合を改善してから製品を市場に出します。このように、製品に潜んでいる欠陥を早めに摘発してしまうことをデバッギング(debugging)と言います。bugとは虫のことで、デバッギングは虫とりのことを意味します。

 次に、バスタブ曲線の底の部分を仮に第2の期間としましょう。この期間は死亡率や故障率が低い値でほぼ一定しています。人間ならば少年期から青年期にかけて、生理的にはつらつとしていて偶発的な事故くらいしか死ぬことがない期間です。偶発的な死しかないから、死亡率も変化がなく、第2の期間の死亡率は一定です。

 デバッギングの終わった製品の場合にも、偶発的な故障−例えば、船のプロペラに鯨が絡まって起こる故障とか、落雷による電磁パルスでICが誤動作することによる故障、ボールに直撃されて破損する窓ガラスなど−だけが発生する第2の期間があり、これも偶然だけが理由なので、故障はほぼ一定で、現実的にも多くのデータがそれを裏付けています。こういう故障を偶発故障(random failure)と言い、この第2の期間は偶発故障期間と呼ばれます。

 ところで、偶発故障などという考え方は、けしからんと思われませんか。偶然に故障が起こったなどというのは無責任です。プロペラに鯨が絡むなら、絡まない手を打つべきだし、電磁パルスでICが誤動作するならその対策を工夫すべきです。ランダムに発生する故障の原因を究明しないまま、偶発故障だから仕方がないと諦めるのおかしい、と。

 実は、このような疑問から、故障の起こるメカニズムの本質に迫り、その対策を見いだすための努力が開始され成果を上げつつある。このための考え方の手法は故障解析(failure analysis)と呼ばれ、信頼性工学の中で占める位置も高まると思われます。

 しかしながら、故障解析の研究がいくら進んでも、偶発故障とみなさざるを得ない故障がなくなるとは思えません。便宜的に、因果関係の筋道があまりにも複雑すぎて、それにこだわっていたのでは話が進まないようなとき、それを偶然として取り扱います。

 バスタブ曲線の右側の部分、つまり第3の期間は、第2の期間では低値安定していた死亡率や故障率が徐々に増加し、ついには加速度的に急上昇する期間です。人間なら生理的にガタがきてぽつりぽつりと死に始め高齢化とともに死亡率が急上昇しとうとう全員が神に召される期間です。

 製品の場合なら、摩耗によって文字どおりガタがきたり、材料が疲労で壊れたりして要求された機能が果たせなくなる時期です。この時期の故障は、原因を摩耗に代表させて摩耗故障と呼ばれます。この期間は摩耗故障期間と名づけられています。

疲労
金属の棒に、弱い力を繰り返し繰り返しかけ続けるとそのうちに棒が折れるがこういう現象を疲労という。また、熱したり冷やしたりを繰り返しても材料に疲労破壊が起こる。

 さて、第1の期間は設計や製造などに潜んでいる欠陥が露呈する時期、第2の期間は人知では偶発故障とかいいようのない故障だけが僅かに発生する期間、第3の期間は長い間酷使の末にガタがきてしまった時期とですから、製品としての働き盛りは第2の期間、すなわち偶発故障期間だけといえます。そこで、偶発故障期間の長さを有効寿命(また耐用命数)と呼ぶことがあります。

 図2-4は、改めてバスタブ曲線を描き、それにこの節ででてきた新しい用語を書き込んだものです。図をみながらこのような名称を与えられた理由を復習してみてください。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 図2-4 バスタブ曲線とその用語


2-3. 故障の起こり方と保全

キーワード
保全 整備

 故障の起こり方に、初期故障、偶発故障、摩耗故障の3段階があることを知ったので、それに対する保全・整備の作戦が見えてきました。

 JISによれば保全(maintenance)とは、

アイテムを使用及び運用可能状態に維持し、または故障、欠点などを回復するためのすべての処置及び活動であり、整備ともいう

となっています。

 まず、製品が初期故障期間にある場合 この期間ではバスタブ曲線にみるように、時間の経過とともに故障率が下がります。不良品が早い時期に淘汰されてしまい、良品だけが残るので故障率が低下します。したがって、この期間は製品をどんどん使い込んで欠陥を摘出する、すなわちデバッギングするのが保全の上から良策です。

 ところで、初期故障期間が終わって偶発故障期間にはいる時期は、どうしたらわかるのでしょうか。(ワイブル分布と形状パラメータm)

 つぎは、偶発期間にある製品の場合 この場合はもうすぐ壊れそうな気がするからと新品に交換するのは馬鹿げています。なしにろ故障は偶発にしか起こらないので、新品と交換しても故障率は変わりません。むしろデバッギングが完全に終わっていない新品と交換すれば、故障率は増加します。

 一般家庭の窓ガラスは、ボールが直撃したりの偶発故障しか起こりませんから、新品に換えたからといって故障率が低下しません。誰でも実感としてこのことはよく知っています。

 ところが、工場や船舶の機械類の保全などでは、たいていの部品は使うほど痛んでくるという先入観があるため、充分に有効寿命の中にあるのに新品と交換してしまうことか少なくありません。

 一般的に、日本では整備不足よりも整備過剰(over-maintenance)によって稼動率を下げていると言われています。

 さて、ここでも問題は、偶発故障期間から摩耗故障期間に移り変わる時点を、どうして察知するかです。(ワイブル分布と形状パラメータm)

 最後は、摩耗故障にはいった製品の場合 これは簡単です。さっそく新品と取り替えます。

 以上の作戦は、1つの大きなシステムでも、多数の同じ製品でも同じです。

3 偶発故障と信頼性

  • 3-1. 減衰曲線の性格(故障率と残量の関係)
  • 3-2. 減衰曲線を式で表す
  • 3-3. 平均寿命とMTBF
  • 3-4. MTBFで37%に減る

3-1. 減衰曲線の性格(故障率と残量の関係)

 平均寿命(MTBF)や信頼度関数を求めるための準備。

 前章で、システムや部品の誕生から死滅までの間に故障率はバスタブ曲線を描き、バスタブ曲線の底の部分、つまり、偶発故障だけが起こる範囲を偶発故障期間といい、その期間が有効寿命であると述べました。この場合、偶発故障は人智を超えた偶然によってだけ起こるのですから、故障率は一定であると信じるほかありませんし、現実のデータもそれを裏付けています。

 しかし、偶然の一つ一つは正体不明でも、偶然を束にして観察するとそこに明瞭に規則性が読み取れます。その規則性を体系づけたものが確率論であり、統計学です。そこで、確率や統計の力をかりて偶発期間中のアイテムの有り様を明らかにして行きましょう。

 まず、故障率が一定とはどういう現象でしょうか。

 ここに100gの物質があって、1時間たつごとに10%ずつ崩壊していくことを考えてみましょう。ラジウムやウラニウムのような放射性物質は自分の目方に正比例した放射線をだして自然に崩壊して行きますから、このような物質の崩壊を故障による摩耗と見なせます。

 立ち上がりに100gだった物質は、1時間後には10%減って90g、その1時間後には90gから10%減の81g、…と計算していくと表3-1のようになります。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 表3-1 物質の崩壊(1時間に10%ずつ減ると)

 この有り様をグラフに描いたのが図3-1です。最初はやや急激に減少しますが、時間の経過とともに減少の仕方が緩やかになっています。しかし、残りの量が0になることはありません。限りなく0に近づいて行きますが、どうしても0にはなりません。これが一定の割合で減少するときの残量の性格です。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 図3-1 物質の崩壊(グラフに描くと)

 この曲線は、時間とともに減衰していくさまを表しているので、減衰曲線と呼ばれます。減衰曲線と指数分布の間には密接な関係があります(後述)。

 図3-2に、故障率をパラメータにとっていくつか減衰曲線を描いてみました。いつも100gから始まるとは限らないので、縦軸の1.0のところから曲線をスタートさせてあります。横軸は、仮に「時の流れ」としていますが、取り扱う現象によっては走行距離としたり、使用回数としたりすます。そして、故障率は、「時の流れ」の1単位当たりに発生する故障の割合ですが、「時の流れ」を際限なく細分化していった究極の値を1単位当たりに換算したものであることに注意を要します。

 図をみると、故障率の大小にかかわらず、最初はやや急激に減少するけれども時間の経過につれて緩やかになり、零に近づいていくものの決して零にならない、という共通の傾向が読み取れます。そして、その傾向は故障率が大きくなるほど顕著に現れます。

3-2. 減衰曲線を式で表す

 平均寿命、半減期、信頼度を求めるために

 故障率と時の流れと残量の関係は図3-2の通りなのですが、このままでは平均寿命を計算したり半減期を求めたりすることができません。数式に表す必要があります。

 当初、つまり時間の経過が零の時の量がAであったとする。それが単位時間当たりkの故障率で減少し続けると、tだけ経過したときの残量yは

y = A * exp( -k * t ); // 式3-1

で表される。

 式3-1で表される曲線を図3-3に示します。おなじみの減衰曲線であることがわかります。この度は当初の量をAとしましたから、曲線の縦軸のAの位置からスタートします。

 また、横軸の目盛は、図3-1や図3-2では横軸は時間の経過そのものでしたが、今度は、それに故障率kを掛け合わせた値で目盛が刻まれています。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 図3-3 y=A*exp(-k*t)で表した減衰曲線

 表3-2に、xを変化させたときのexp(-x)の値を数表にしておきます。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 表3-2 exp(-x)の値

 これらを実例に応用してみましょう。

例題1 水槽の中の生き残った魚の残量

 大きな濁った水槽の中にたくさんの小魚が勝手気ままに泳いでいます。腕白小僧が、盲滅法に網で魚をすくいとるのですが、偶然にすくい上げられる魚の数は水槽の中に残っている魚の数に正比例し、1分当たり1%の割合で犠牲になります。10分後には水槽の中の魚は最初の何%に減ってしまうでしょうか。

 この場合、kは、0.01/分です。そして10分経過したときのk*tは

kt = 0.01/分 * 10分 = 0.1; // 式3-2

です。したがって、式3-1によって10分後の残量は

y = A * exp( -0.1 ); // 式3-3

であるに違いありません。そこで表3-2を見ます。

exp( -0.1 ) = 0.90484 ≒ 0.905;

ですから、10分後の残量は

y = 0.905 * A; // 式3-4

 すなわち、当初の魚の数の約90.5%が水槽の中に生き残っていることがわかります。


例題2 水槽の中の魚が半分になるまでの時間

 同じ想定を使います。水槽の中の魚が約半分に減ってしまうのは何分たったときでしょうか。

 この場合は、

y = 0.5 * A; // 式3-5

になるようなtを見つければよい。つまり

0.5 = exp( -k * t );

になるようなtを探します。表3-2をみると

exp( -0.7 ) =  0.49695 ≒ 0.5; // 式3-7

です。すなわち

0.7 = k * t = 0.01/分 * t; // 式3-8
∴ t = 70分; // 式3-9

と求まります。

例題3 ある製品の故障率と信頼度

 デバッギングが終わったある製品1350個を20日間使い続けたら40個が故障しました。この製品の故障率はいくらでしょうか。また、この製品が同じ条件下で200日間の使用に耐えられるように規定されているとしたら、この製品の信頼度はいくらと予測されますか。

 20日間の使用で40個が故障したのですから、そのときまで故障せずに残っている残数は1310個です。これらの値を式3-1にいれると

1310 = 1350 * exp( -20 * k ); // 式3-10

となります。ここで、1310と1350の単位は個、20の単位は日です。

 この式を変形すると

20 * k = -log( 1310 / 1350 ); // 式3-11

であることがわかる。表3-2からexp(-x)が0.970とほぼ同じになるxは0.03です。つまり

20 * k = 0.03; // 式3-12
∴k = 0.0015

が求まります。もちろん故障率の単位は1日当たりです(故障率は理論的には瞬間の値です)。

 次に、200日間使用に耐えられる信頼度を求めましょう。200日たったときのk*tは

0.0015/日 * 200日 = 0.3; // 式3-13

ですし、表3-2から

exp( -0.3 ) ≒ 0.741; // 式3-14

です。実はこの値がそのまま信頼度なのですが、念のために確認します。

 式3-1から200日後の生存数yは

y = 1350 * 0.741 ≒ 1000; // 式3-15

であることが期待されます。すなわち、1350個の内1000個が200日間働き通すだろうと見込んでいいでしょう。信頼度は先に述べたように、規定の時間を通して機能を果たす確率ですから、この場合の、信頼度Rは

// 式3-16

というわけで、式3-14の値と一致するわけです。

3-3. 平均寿命とMTBF

 平均寿命を求めます。そして、それが平均故障間隔(MTBF)に等しいことを述べます。

平均寿命

 偶発故障期間では、故障率が一定で、残量は減衰曲線を示すこと観察しました。

 ところで、水槽の中の小魚のことを思い出していただきたい。1分当たり1%の割合で犠牲になっていくと、10分後には当初の数の90.5%に減少するし、70分後には半分になるのでした。小魚の中にはわずか数分で落命する哀れなものもいるし、数百分たっても生き延びているものもいます。それでは、いったい、平均寿命はどれくらいなのでしょうか。

 図3-4をみてください。これは先にでてきた減衰曲線を90゜だけ回転したものです。この曲線はうまいぐあいに彼らの寿命の度数を表していることがわかります。横軸をA個に区切り、A本の棒グラフがあるとみなせば、1本1本の棒の高さが小魚ごとの寿命を表しています。すなわち、Aに近いほど寿命が短い小魚たちがいること、右の端に行くほど寿命の長い小魚が多くいることを示しています。

&ref(): File not found: "nokink" at page "信頼性工学ノート"; 図3-4 小魚たちの寿命のグラフ

 ここから、小魚たちの寿命の平均値を求める筋道は明らかです。高い棒の頭を削って低い棒へ配分し、棒の高さを揃えれば、その高さが平均寿命になるに違いありません。

 そして、図を90゜だけ元へ戻します。図3.5のようになります。図の中で薄ずみを塗った長方形の面積を、減衰曲線と縦軸及び横軸に囲まれた面積に等しくしてあります。つまり

k * t = 1; // 式3-17

のとき、言い換えれば

// 式3-18

のとき、平均寿命なのです。

&ref(): File not found: "nolink" at page "信頼性工学ノート"; 図3-5 こうして平均寿命がわかる

 たとえば、前節の例題3では、この製品の故障率kが

k = 0.0015/日

でしたが、この製品の平均寿命を知りたければ、式3-18を活用して

// 式3-19

という具合です。

MTBF

 ここで、ちょっと視点を変えてみます。1350個の製品を20日使ったら40個だけ故障して残りが1310個になったことを考えた。そして、この事実をもとに故障率が0.0015/日で、平均寿命が667日であることがわかった。故障した製品は取り除き、代わりにデバッギングの終わった新品と取り替えて補充して、常に1350個を機能させとおくと想定してください。製品の使われ方としてはこの方が普通だからです。

 このようにすると機能している1350個の製品には、当初からがんばっているのもあるし、途中から働きだしたのもいる。しかし、途中から働きだした製品であっても、やはり平均寿命が667日の製品であることには変わりはありません。そうすると、ある製品が戦列に参加した日から数えて、平均的には667日後に故障が発生することになります。つまり見方を変えれば、平均寿命は個々の製品についての平均的な故障間隔であるといえるでしょう。で、信頼性工学では平均寿命を平均故障間隔(mean time between failures)と名付け、普通これをMTBFと略して呼びます。式3-18を借用して

// 式3-20

の関係があることになります。MTTFという略語もありますが、これは平均故障寿命(mean time to failure)の略で、MTBFや平均寿命(mean life)と同じ値です。

 製品、一般的にいうとアイテムの信頼性の程度を定量的に表現する物差しの第1は、もちろん信頼度です。それと並んでMTBFも非常によく使われます。理由の主なものは次の2つです。

 電子機器の部品や計器、モーターなどのような汎用性のある製品は、市場にでた後いろいろなシステムに組み込まれて使用されますが、使用時間はシステムによってまちまちです。それでも信頼性を信頼度で表示しようとするなら、製品のメーカがあらかじめ勝手に使用時間を想定しなければなりません。それはあまり適当な方法とは思えません。そこで、メーカーでは使用時間とは無関係なMTBFを表示しておき、ユーザーがそれぞれの使用時間に応じて信頼度を算出することができるようにしておきます。これが第1の理由です。

 また、多くのアイテムは故障したらそれで終わりではなく、故障したらその都度修理して長く使用される方が普通です。こういうとき、信頼性を平均故障間隔(MTBF)で表示されている方がなじみやすいのです。これが第2の理由です。

 もちろんMTBFではなく、故障率で信頼性の程度を表すことも少なくありません。なにしろ、MTBFと故障率は互いに逆数の関係にあるのですから。


3-4. MTBFで37%に減る

キーワード
半減期 時定数 MTBF 平均寿命

 世の中には減衰曲線で表される現象がたくさんある。その中の1つが放射性物質の崩壊です。ラジウムなどの放射性物質は自分の目方に比例した放射線を出して自然に崩壊し、他の物質に変わっていく。そして残量はきれいな減衰曲線(exp(-k*t)曲線)になります。ところで、放射性物質の寿命はどのように表しているのでしょうか。ある塊がだんだん小さくなっていくのですが、しかし、いつまでも消滅することはありません。子魚の集団なら、1匹1匹の寿命を平均した平均寿命という値が説得力をもちますが、ラジウムやウラニウムに平均寿命という概念はふさわしくありません。そこで、残量がもとの半分になるまでの時間、すなわち半減期を寿命の目安にします。

 半減期は

y / A = exp( -k * t ) = 0.5;

となるようなtを求めることですから、exp(-x)の数表から

k * t = -log( 0.5 );

となります。例えば、ラジウムの半減期は1622年、ウラニウムの半減期は4.5*pow(10,9)年です。

&ref(): File not found: "nolink" at page "信頼性工学ノート"; 図3-6 半減期を求める

 もう1つの例、温かいコーヒーも放っておっくとだんだんさめてきます。温かいコーヒーが室温との温度差に比例して熱量を放出するからです。

 この場合、コーヒーの温度と室温との差は減衰曲線を描き、時間の経過とともに限りなく0に近づいて行きます。こういうとき、温度差の現象を表現するのに平均寿命の概念は全くふさわしくないし、また半減期もしっくりきません。そこで、時定数(time constant)という表し方をします。

 それは、最初できたてのコーヒーは室温との温度差がAだけあり、それに比例した値k*Aの割合で温度差が減少していきます。もしこの冷め方が持続されるならば、ある時間を経過した後には温度差は零になってしまうに違いありません。その経過時間が時定数であり、これをもって冷め方を表現しようというのです。

 図3.7をみてください。

&ref(): File not found: "nolink" at page "信頼性工学ノート"; 図3-7 時定数を求める

 t=0のところ、すなわちスタートのところで減衰曲線に接線を引き、それが横軸にぶつかる位置、その位置が時定数を表します。なんとその位置はk*t=1,すなわち平均寿命とぴったり一致しているから愉快ではありませんか。k*t=1ですから時定数tは

 上式は式3-18の平均寿命の式と同じ、すなわち、時定数と平均寿命(MTBF)は同じ値です。

 偶発故障期間にある製品の場合、平均寿命だけ時間が経過すると、言い換えればMTBFだけ経つと当初の量Aの何%に減るでしょうか。平均寿命はk*t=1になるようなtだから、式3-1によって

y=Ae−1                                             (3.23)

まで減ります。

e−1=0.36788≒37%                  (3.24) 

ですから、MTBFだけ経つと37%に減る、決して半分に減るのではありません。半分に減るまでの時間、すなわち半減期はkt=0.7となるようなtで表せるのでした。したがって、平均寿命を表す式(3.17)と比較してみれば

	半減期≒平均寿命(MTBF)×0。7               (3.25)

という関係にあるのは明らかです。このあたりは信頼性工学の常識です。 ┌──────────────────────────────────┐ │ │ │ │ │ │ │ │ │ │ └──────────────────────────────────┘ 図3.8 半減期とMTBFの関係

信頼度曲線  信頼度、信頼度曲線、故障確率、故障確率曲線

 私たちは、故障率が一定なら故障せずに働き続けている残数は減衰曲線を描くことを知った。そのとき、当初の量をAとして、減衰曲線はAからスタートさせた。ところで、ある規定の時間を経過したとき機能し続けている残数がyに減っているとすれば、この製品の信頼度Rは

	R=y/A                                              (3.26)

です。信頼度は「規定の時間を通して機能を果たす確率」だからです。したがって、Aからスターとしている減衰曲線の縦軸の目盛をAで割り、1からスタートするように描き直せば、それが信頼度を表す曲線になる。  図3.9に信頼度曲線を示す。既に何度もでてきた減衰曲線ですが、信頼度Rが時間tの関数なので、Rがtの関数であることを強調するためにR(t)と書きました。  このR(t)は減衰曲線y=e−ktをAで割ったものですから、その方程式は

	R(t)=e−kt                                          (3.27)

であることに異論はないでしょう。  信頼度曲線は減衰曲線と目盛の刻み方が異なるだけで曲線そのものの性質は同じですから、減衰曲線に性格はそのまま信頼度曲線に当てはまります。例えば、MTBFだけ経ったときの信頼度は37%であり、信頼度が50%になるのは MTBF×0。7のときである。 ┌──────────────────────────────────┐ │ │ │ │ │ │ │ │ │ │ └──────────────────────────────────┘ 図3.9 これが信頼度曲線

 故障確率、故障確率曲線  図3.10をみてください。,呂△訐宿覆了栂未慮鎖蟠弊です。Δ,Aで割った信頼度曲線でした。

図3。10 信頼度曲線と故障確率曲線

 ここで、ものの見方を少し変えてみましょう。,聾両磴爾困傍’修径海韻討い觧栂未任△蝓各瞬間に発生する故障数はこの残量に比例するから、故障の発生数は△里茲Δ砲覆襦そして、△龍弊が作り出す面積はAです。なぜなら、この面積はすべての瞬間に発生した故障の総計を意味しているし、無限の時間が経った後には全数Aが故障し尽くしているからです。図3.10の△量明僂蓮⊆,猟未蝓

	

そこで、△僚勅瓦鬘舛燃笋譴侈明僂1の曲線に変身します。それがです。  は、瞬間瞬間に発生する故障の確率密度のグラフになっている。そして、この曲線の方程式が

	f(t)=ke−kt                     (3.28)

であることは明かです。この分布の形は指数分布と呼ばれ、分布のグラフでは縦軸が確率密度関数を表す。  ある時間が経過したときまでに発生する故障の割合、言い換えると、ある時間内に故障する確率は図に薄墨を塗った部分の面積で表される。その面積は

	

その面積の値をtの経過を追いながら求めていくとい砲覆蝓△海譴漏峠峇屬慮両磴粒領密度を累計したものですから、ある時間が経過するまでに故障が発生する確率、一言でいえば故障確率を示すことになる。この曲線の方程式は

	F(t)=1-e−kt                                        (2.29)

で表される。  さて、信頼度は先に述べたように故障しない確率であり、

	

でしたから、式(2.29)によって

	R(t)=1-{1-e−kt}=e−kt                             (2.30)

という筋書きになります。図3.10でい1から引いた値、つまりい両絏爾魑佞気泙砲靴燭發里Δ砲覆辰討い襪里わかります。こうして、□→あΔ里垢犬澆舛鬚燭匹R(t)=e−ktの結論に到達することができました。  さらに、もう一つの筋道をたどってみましょう。,聾両磴靴覆い乃’修靴討い觧栂未任垢ら、これを当初のAで差し引けば故障してしまった数量、つまり、故障の累計になる。図の,らイ龍敍擦任△蝓曲線が上下逆さまになってしまいました。これをAで割る、そうすると、故障の累計が当初の数量に対して占める割合、言い換えれば故障の確率を表す曲線い得られる。こうして、´キきΔ鬚燭匹辰討癲⊃頼度がR(t)=e−ktで表されることが確認できる。

 問題は、製品が故障率一定の期間にあるかどうか、バスタブのそこにあるかどうかを見破る方法であります。初期故障や摩耗故障の期間にありながら、この章の理屈をふりまわしてもピントはずれもいいところだからです。これについては後にゆずる予定になっている。

┌─────────── この章でたいせつな式 ────────────┐ │・tだけ経ったときの残量yは、当初の量をAとして │ │ y=Ae−kt (k:故障率)           (3.1) │ │ そして R=y/A だから    (3.26) │ │ R(t)=e−kt (3.27) │ │・MTBFと故障率の関係は │ │ MTBF=                 (3.20)   │ │・半減期とMTBFの関係は │ │ 半減期≒平均寿命(MTBF)×0.7   (3.25) │ │・故障の分布は │ │ f(t)=ke−kt                     (3.28) │ │・故障の確率は │ │ F(t)=1-e−kt (2.29) │ └──────────────────────────────────┘

4. 直列と並列の信頼性

直列システムのきびしさ  直列 AND

 図4.1のように3つの部品が直列に連なったシステムがあると思っていただきます。これらの部品が水道のバルブなら1つでも詰まってしまうと水が流れません。また、一つ一つがスイッチであれば一つでも故障すると電流は流れません。このような部品の連なり方を直列といいます。人によってはANDになっているという。1つめの部品and2つめの部品and3つめの部品が健全なときだけシステムとして健全だからです。 ┌──────────────────────────────────┐ │ │ │ │ │ │ └──────────────────────────────────┘ 図4.1 直列システム

 このように、システムはたいてい多くのアイテムから成り立っているが、1つのアイテムが故障するとシステムとして機能しなくなる場合、信頼性工学では、アイテムは直列であるという。  さて、図4.1のように記入してあるように、それぞれの部品の信頼度、すなわち、規定の時間を通じて故障せずに機能する確率をr1,r2,r3としましょう。そうすると、システムとして故障しない確率R、すなわち信頼度は

	R=r1r2r3                                           (4.1)

となります。 [例 直列システムの信頼度の計算]  具体例を一つ計算してみよう。1つめの部品のMTBFが1000時間、2つめのそれは2000時間、3つめは2500時間であるとき、システムが100時間は正常に機能するように規定されていたとすれば、このシステムの信頼度はいくらでしょうか。

並列システムの冗長性  並列 OR 冗長性(redundancy) 冗長性の効きめ  冗長度 常用冗長 待機冗長 直列・並列などが混ざったシステム

5。保全とアベイラビリティ 信頼性を補うために フェールセーフ(fail safe) MTTR(mean time to repair) 保全 保全性 保全度 平均修復期間(MTTR) 修復率 アベイラビリティ(availability) 固有アベイラビリティ 修理系 アベイラビリティは広義の信頼性 CMとPM  事後保全(corrective maintenance) 予防保全(preventive maintenance) 保全の分類  時間計画保全と状態監視保全 定期保全と経時保全 緊急保全と通常事後保全 6。信頼性を創り込む 部品の数を減らす 階層構造の力をかりる 伝染防止 例、ヒューズ  フールプルーフ 標準品を採用する 保全性を創り込む  接近性(accessibility) モジュール構造 疲労破壊  S−N曲線 マイナーの法則 7。データで信頼性を判断する バスタブ曲線とワイブル分布 ワイブル分布  m、γ、t0:形状パラメータ、位置パラメータ、尺度パラメータ ワイブル確率紙 mを求めて故障のタイプを判断する mのついでにγとt0も求める 信頼性のデータを集める 抜き取り検査  破壊検査 非破壊検査 生産者のリスク 消費者のリスク OC曲線 中途打切試験 加速試験 環境のきびしさを模擬する  環境試験 8。信頼性を評価する デザイン・レビュー(design review) FTA(fault tree analysis)  オア・ゲート アンド・ゲート FMEA(failure mode and effects analysis) FMECA(failure mode effects and criticality analysis)

メモ 自転車、自動車の故障と保守


*1 AGREEは、Advisory Group on Reliability of Electronic Equipmentの頭文字を連ねたものです。