クレイジーな解説:人々の生活はますますデータ分析に依存するようになっています。組織運営から医療計画の決定、さらにはアスリートのトレーニングルートの決定に至るまで、計画を策定するためにはデータに頼る必要があります。しかし、このデータを実際に使用しているかどうかはどうすればわかるのでしょうか?データの信頼性の問題は、テクノロジーや学術とは関係ありませんが、決して無視できる問題ではありません。この記事ではこの点について詳しく説明します。 翻訳: spring_zqy 現代は誰もがビッグデータの時代に生きていますが、これを言って皆さんを怖がらせようとしているわけではありません。 データ分析とデータに基づく意思決定は、ますます多くの分野でゴールドスタンダードとなっています。組織の運営から医療上の意思決定、さらにはアスリートのトレーニングルートの決定に至るまで、データはますます私たちの生活の中心になっています。 多くの人がこれが必要だと考えています。素朴な質問をしたいと思います。このデータが本当に使用されているかどうかは、どうすればわかるのでしょうか? ここで明確にしておきたいのは、私は意思決定を改善するためにデータを使用することを疑問視しているわけではないということです。それどころか、これこそが私たちがすべきことだと私は思います。私の質問はデータ保守技術に関するものではありません。 (「データ整合性」、「データ損失」、「データ破損」などの用語を Baidu で検索すると、これらに対処するための無数の標準とベスト プラクティスがあることがわかります)。 私の質問は実は非常に基本的なものです。 決定する必要があるイベントに関連するデータセットがあり、技術的に問題がない場合、実際にこのコンテンツをどのように信頼できるのでしょうか? 信頼の構築 よく考えてみると、なぜ私たちがデータに頼らなければならないのかがすぐにわかります。それは、垂直統合と信頼できる第三者です。 最も簡単な 2 つの例を挙げて説明しましょう。 垂直統合には、データセットを構成するバリュー チェーン全体を所有するあらゆるシナリオが含まれます。 Fitbit (または他の同様のアクティビティ トラッカー) と同様に、データを生成するセンサーがあり、データが生成されるときにユーザーがそこにいます。 一日の終わりには、その日の活動を示すデータが得られるので、「今日は少し多く動いた。いつもの 2,000 歩ではなく、今日は 3,000 歩歩いた」などと言うことができます。実際、アクティビティ データ セットの作成におけるすべてのステップはユーザーが所有しているため、このタイプのデータの有効性を受け入れるのは簡単です。 信頼できる第三者には、データを生成または追跡し、それによってデータの有効性を認める、当社が信頼する当事者が含まれます。 自分のウェブページを訪問した人数を知りたいときは、Google アナリティクスを確認します。私は Google を信頼しているので(信頼すべきかどうかは疑問ですが)、そのデータの妥当性を受け入れています。 グレーゾーン これらの例は単純ですが、データ依存性の問題の範囲は明らかに広範囲です。 上で述べたシナリオは、データ生成プロセスを所有していない限り、他の当事者のデータに頼る前に、その当事者を信頼せざるを得ないことを示しています。この状況の複雑さは、モノのインターネットによって生成されるデータへの依存を考慮すると明らかになります。 2007年の悲劇では、I-35Wミシシッピ川橋が崩落し、13人が死亡しました。その後、橋は再建され、現在では橋の張力、荷重分布、振動、温度などを検知する 500 個以上のセンサーが組み込まれています。表面的には、これで問題は解決したように見えます。何か気になる兆候があれば、センサーが事前に知らせてくれるので、メンテナンスチームを派遣して災害を防ぐことができます。 しかし、これが機能するためには、センサー データに完全に依存する必要があります。そこで疑問になるのは、なぜそうしないのかということです。 センサーが故障しているが、橋に問題がないことを示す情報を中継し続けるシナリオを考えてみましょう。簡単にするために、センサーが 2 種類のデータを生成すると仮定します。1 つは「良好」で、橋に問題がないことを示します。もう 1 つは「不良」で、メンテナンス チームを派遣する必要があることを示しています。 「データ垂直統合」技術が存在しない、つまりIoTセンサーはA社が所有し、メンテナンスチームはB社から来る、という状況が想像できます。 センサーが「正しい」情報を送信しているときに橋が崩壊した場合、センサーが正しい情報を送信していなかったため、A 社が全責任を負うことになります。 ただし、センサーが「不良」の兆候を示し、メンテナンスチームが現場に到着しない場合は、B 社が全責任を負うことになります。これにより、A 社は、データ セットを変更してセンサーが警告を送信したが、B 社はそれを無視したことを示すことで「不正行為」を行う十分な動機が得られます。 私はこの悲しい例を使って問題の深刻さを示しましたが、実際に私が話している状況は、テレビ、食器洗い機、その他の IoT デバイス アプリケーションで簡単に発生する可能性があります。 ブロックチェーンソリューション 大規模な市場の動向と考察に基づくと、これはまもなく誰もが持つテクノロジーになるでしょう。また、データ依存性の問題は学術的な問題ではなく、「その問題は後で考えましょう」と簡単に分類できる問題でもないことも思い出していただきたいと思います。 世界中の法執行機関はすでに、犯罪容疑者の所在を突き止めるために携帯電話データの利用を拡大している。 採掘されたデータは、容疑者の有罪を立証したり、アリバイを証明するための裏付け証拠として使用できます。以前の事件では、ネットワークエンジニアが妻を殺害したとして告発された。彼はこの技術を使ってネットワーク機器にアクセスし、妻が電話をかけているように見せかけようとしたが、実際には妻はすでに亡くなっていた。 このデータ依存の問題は非常に重要であり、私たちは常にそれについて考える必要があると思います。 偶然にも、私の立場では、この問題を提起するだけでなく、解決策を提案することもできます。私にとって、すべてのデータを自分たちで所有したり、他人のデータを盲目的に信頼したりすることなく、何が正しくて何が間違っているかを判断し、お互いに合意に達するためのインフラストラクチャが整っていることは明らかです。 そのアーキテクチャは、もちろんブロックチェーン技術であり、多くの既存のシステムと統合され、データの信頼性を新たなレベルに引き上げるために不可欠であると考えています。 特に、データからより多くの価値を引き出すにはブロックチェーン ベースのソリューションが必要だと私は考えています。ここでは、その点についていくつか言及したいと思います。 データ分析 保険金請求 記録管理 規制遵守 つまり、データは私たちの生活にとってますます重要になってきており、データ依存の問題については繰り返し言及していきたいと思います。 これを解決するには、これは単にデータの所有権の問題ではなく、他の当事者が「信頼できるかもしれない」という仮定の問題でもないという疑問を抱く必要があります。 ブロックチェーン技術は、この問題に対して効率的かつ適用性の高いソリューションを提供し、最終的にはデータ依存性の問題に対する普遍的な標準を生み出すでしょう。 |
<<: 世界経済フォーラム: ブロックチェーンの主流化は避けられないが、ビットコインもそれに続くだろうか?
>>: ブロックチェーンは15億人の身元を検証し、政府と企業のガバナンスを変革する
ユニバーシティ・カレッジ・ロンドン(UCL)ブロックチェーン技術センターの研究報告書(コインライブラ...
テキスト |ウー・ジハン制作 |マーズファイナンスアプリ(ID: hxcj24h) この記事は、Ma...
対照的に、Superstate の利点は、創設者が暗号通貨業界の富裕層から十分なリソースを得ているこ...
注: この記事はもともと、Gavin Wood 氏のブログ「Insights into a Mode...
規制に関するニュースが活発化し、週足は圧迫され、統合された。 1. 市場動向<br/>今...
呉碩 著者 |タン・シュウこの号の編集者 |コリン・ウーイーサリアムの時価総額がビットコインを上回る...
志光大学が鉱山見学に連れて行ってくれて、新疆旅行は大成功に終わりました。編集者は皆、鉱山への現地訪問...
Brexit国民投票を受けて、多くの金融ニュースメディアはビットコインがますます信頼できる安全資産に...
2014 年に多数の匿名コインが登場し、ブロックチェーンのプライバシー概念が台頭して以来、暗号通貨の...
ブロックチェーンは、米国やヨーロッパの金融業界の注目を集めています。銀行業界は関連アプリケーションの...
マイニングファームのオーナーであるケネン氏は、4月2日にビットコインが5,000ドルを超え始めたとき...
第2回「Rendaシニアドクターフォーラム」が2015年11月7日に北京で開催され、中国銀行元チーフ...
マイクロソフト社の元社員が16日、同社のオンライン小売プラットフォームから1000万ドル(約6880...
Bitpushのデータによると、最大の時価総額を持つ暗号通貨ビットコインは、過去24時間で2回の小幅...
Bitpushによると、米国証券取引委員会(SEC)は大手暗号通貨取引所Coinbaseのナスダッ...