私は普段、金融サービス業界のクライアントと多くの時間を過ごし、財務報告、財務分析、そして財務報告を支えるシステムについて密接に協力しています。そして、どの企業からも繰り返し同じことを耳にします。
「当社のデータウェアハウスは高速です。」「ダッシュボードは読み込みさえすれば問題ありません。」「パイプラインによってはほぼリアルタイムです。」
しばらくすると、その物語がどのように展開するかを、実際に目の前に示される前にほぼ予測できるようになります。
.png?width=736&disable=upscale&auto=webp)
遅延が会議を台無しにする場合
私がそれを初めてはっきりと認識したのは、ごく普通のポートフォリオレビューのはずだった時のことでした。
私たちはダッシュボードを見ていました。数字は問題なさそうでした。すると誰かが、一見簡単な質問をしました。「地域別に細分化して、直近の2回の変動率の急上昇を重ねて表示できますか?」
アナリストはフィルターをいくつか追加して適用ボタンを押しました。グラフは消え、代わりにスピナーが表示されました。数秒が経過しました。誰も何も言いませんでしたが、部屋の雰囲気は変わり始めました。フォローアップの質問に集中する代わりに、新たな疑問が浮かび上がりました。このデータは最新のものなのか?これはリアルタイムにどれくらい近いのか?私たちは間違った状況を見て、それに基づいて行動しようとしているのではないか?
これは、金融サービスにおける分析の遅さがもたらす真のコストです。単なる業績指標にとどまらず、人々が分析結果への信頼を失い、意思決定に慎重な姿勢を取り始める地点なのです。
だから、「うちのデータウェアハウスは処理が速い」という話を聞くと、少し身構え てしまうのです。確かに、一人で使用する分には速いかもしれませんが、デスク全体、製品ライン全体、あるいは経営陣が同時にダッシュボードを操作するような状況では、速く感じるとは限りません。
実際には、モダナイゼーションプロジェクトは、企業が実際の負荷状況下で迅速な回答を必要とし、既存のプラットフォームでは対応しきれない場合に開始されます。
そして、このような運用方法への圧力は高まる一方です。金融機関は、過去のデータに基づく報告からリアルタイムの意思決定へと移行するよう、ますます強い圧力を受けています。デロイトの財務リーダーシップ動向分析で強調されているように、財務チームは戦略策定においてますます重要な役割を担い、クラウド、AI、高度な分析などのテクノロジーを活用してビジネス成果を上げています。銀行や資本市場企業にとって、この変化はデータインフラストラクチャの基準を引き上げます。大量のライブデータを照会し、高い同時実行性をサポートし、事象の発生と同時に即座にインサイトを提供できることが求められます。
アナリティクスは現在はライブシステムである
10年、15年前を振り返ってみると、銀行や資本市場における多くの分析業務は、まるでレールの上を走っているかのようでした。データは夜間に届き、ETLパイプラインが処理を終え、翌朝には財務報告書や財務諸表が企業に届けられていました。そこで生じる疑問は、概して、後日改めてそのテーマについて議論するための提案に過ぎませんでした。
こうしたことは今でも起こっていますが、人々の期待は劇的に変化しました。
アドバイザリーチーム、リスクマネージャー、プロダクトリーダー、そして経営幹部は、データをリアルタイムで分析できる機能を求めています。顧客との電話会議中にダッシュボードをクリックしたり、会議の途中でビューを切り替えたり、急激なデータ増加を即座に分析したりできる必要があります。後から送られてくるデータパックを待つ必要はないのです。
最新のビジネスインテリジェンス(BI)ツールは、散在する抽出や重複したデータセットを排除するために、直接クエリなどのパターンをますます重視するようになっています。このモデルでは、ダッシュボードとのあらゆるインタラクションが基となるデータソースに対するクエリをトリガーし、リアルタイムの財務分析 やインタラクティブな財務レポート作成を可能にします。Power BI DirectQueryに関するMicrosoftのガイダンスでは、各ビジュアルまたはインタラクションによってデータベースに直接送信されるクエリが生成されるため、全体的なユーザーエクスペリエンスは基となるシステムのパフォーマンスとスケーラビリティに大きく依存すると強調されています。使用頻度が低い場合はこれで問題ありませんが、ユーザー、ビジュアル、クエリの数が増えるにつれて、データベースにかかる負荷が急速に増加するため、高性能な分析プラットフォームの必要性が高まります。
ほとんどの金融機関にとって、同じ分析ツールは同時に非常に異なる顧客層にサービスを提供することになります。
- 中央データチームが共有モデルと企業レポートを管理します。
- リスクアナリストやポートフォリオアナリストは、より負荷の高い、探索的なクエリを実行します。
- 製品開発チームとアプリ開発チームは、顧客向けのエクスペリエンスにグラフやKPIを組み込みます。
- 運用チームはリアルタイムの信号とアラートを監視しています。
ダッシュボードの動作が遅くなると、ほとんどの人はダッシュボード自体に不満を抱きます。しかし、本当の問題はたいてい水面下にあります。このプラットフォームは、高い同時実行性とデータの鮮度を両立させるような要件を満たすように設計されていないのです。
イベント駆動型データは期待を変えた
同時に、金融機関におけるデータの流れ方も変化しました。
現在、多くのチームがイベント駆動型設計を採用しています。これは、システムを疎結合かつ応答性の高い状態に保つための実用的な方法だからです。Apache Kafkaは、支払い、注文、取引から顧客とのやり取り、プラットフォームのテレメトリに至るまで、あらゆるデータを伝送するために頻繁に使用されています。
変更データキャプチャ(CDC)は、同じ概念を異なる視点から捉えたものです。夜間のバッチ処理を待つのではなく、CDCは運用データベースから下流システムへ、変更が発生した時点でストリーミング配信します。クラウドプロバイダーは、リアルタイム分析や財務分析の基盤として、この方式をますます推奨しています。なぜなら、「発生したこと」と「それを確認できること」のギャップを縮小できるからです。
これらのパターンが導入されると、別の変化が起こりました。ビジネス側は、スタックの残りの部分も同様に、よりリアルタイムな動作を期待するようになったのです。
新たな言い訳や説明が次々と現れ始めます。「これは前回更新時点での正確な情報です」「パイプラインによってはほぼリアルタイムです」「リアルタイムですが、サービングレイヤーに到達してからになります」など。こうした説明は、制限値の調整、エクスポージャーのリバランス、あるいは顧客への現在のポジション表示を行う際に、信頼感を抱かせるものではありません。
リーダーたちは通常、この時点で「データウェアハウスの処理速度を少しでも速くするにはどうすればいいか?」という問いを捨て、代わりに「大規模でインタラクティブな最新分析に対応できる体制を実際に構築できたか?」という問いに切り替えます。
既存のスタックが金融規模の負荷に耐えられない理由
公平に言えば、問題は特定の技術が悪いということではありません。現在使用されているプラ
痛みは、以下のような典型的なパターンで現れます。
- バッチ処理を優先する設計では、ウィンドウを可能な限り縮小しても、避けられない遅延が発生する。
- OLTPとOLAPを厳密に分離することで、データが分析可能な状態になるまでに複数の段階を経ることを強制している。
- 数百人、数千人のユーザーが同時に利用している場合、予測可能な遅延よりも、生のスループットを重視している。
財務業務の負荷は決して整然とした一定のパターンで推移するものではなく、市場が開く時、ボラティリティが急上昇する時、月末、規制発表後、あるいは運営委員会が会議開始の5分前に同じダッシュボードを開く時など、波のように押し寄せてきます。
プラットフォームがこのような波状の需要に対応できない場合、人々は特定のダッシュボード専用の事前集計やサマリーテーブルを導入することで対応します。リアルタイム性を必要とするものにはキャッシュや特別なパイプラインを追加し、場合によってはユースケース全体を別のシステムにルーティングすることもあります。
時が経つにつれ、こうした回避策が事実上の標準アーキテクチャとなります。
これは複雑さを招き、行動様式にも影響を与えます。チームはダッシュボードが時間内に読み込まれるか不安なため、ライブデモの代わりにスクリーンショットを用意します。リスクマネージャーは重要なクエリを営業時間外に実行し、その数値をスライドに貼り付けます。製品チームはバックエンドの安定性に自信が持てないため、より高度な分析機能の実装を控えます。
金融分野におけるハイパフォーマンスのより有用な定義
だから私は「速い」という言葉が出てくるたびに、その意味を掘り下げて考えるようにしているのです。
プラットフォームが1人か2人のテストユーザーに対して優れた平均クエリ時間を示したとしても、それは興味深いものの、決定的な要素とは言えません。金融サービスにおいては、より適切な高性能の定義は次のようになります。
- デモだけでなく、ユーザーが実際に実行するクエリにおいても、レイテンシが低く抑えられている。
- 同時実行処理は、ピーク時の負荷変動も含め、適切に処理される。
- パフォーマンスが予測可能になった。重要な通話を中断させる可能性があった、時折発生する10秒の応答時間が解消された。
- 鮮度は最初から組み込まれている。最新データへのアクセスはシームレスであるべきで、複雑なカスタム構築されたデータ経路に依存するべきではない。
この定義は、多くの金融機関がより広範に分析とデータプラットフォームを再考している状況と一致しています。リアルタイム分析と運用分析は、「イノベーションプロジェクト」から、日々の意思決定の中心へと移行しつつあります。
また、これにより様々な関係者に共通のフレームワークが提供されます。プロダクトオーナーはこれらの特性をユーザーエクスペリエンスにマッピングできます。リスクリーダーはそれらをコントロールと適時性にマッピングできます。データリーダーはそれらをアーキテクチャと運用にマッピングできます。
SingleStore はその中でどのような位置づけになるのか
こうした背景を踏まえると、SingleStoreがどのような位置づけにあるのかを説明しやすくなります。
SingleStoreは、高スループットのデータ取り込みと低遅延の大規模分析を組み合わせた分散型SQLデータベースです。ストリーミングデータとバッチデータの両方を処理し、トランザクションワークロードと分析ワークロードの両方をサポートし、多数のユーザーが同時に利用している場合でも応答性を維持するように設計されています。
アーキテクチャの観点から言えば、その目的はシンプルです。複数の変換やデータ移動のレイヤーを経ることなく、新鮮なデータをクエリできるようにすることで、より高速な財務分析と、より応答性の高い財務報告を実現します。そのため、SingleStoreはストリームの取り込み、高速な書き込み処理、そして分析クエリの提供を同一エンジンで行うことに重点を置いています。
リアルタイム分析に関する技術的な詳細を知りたい場合は、 製品ドキュメントを参照するのが最適な出発点です。
成果を重視したい方のために、少し前にリアルタイムデータウェアハウスを構築するための設計原則を解説した記事を書きました。このガイドラインは、多くの金融サービスチームが目指していること、つまりバッチ処理時間を短縮し、コピー数を減らし、利用量が急増した場合でもダッシュボードのインタラクティブ性を維持するという目標と密接に合致しています。
お客様と打ち合わせをする際、私たちは通常、リアルタイムのポートフォリオおよびリスクダッシュボード、不正行為や異常検知、デジタルバンキングや資産運用における組み込み型分析など、価値の高いユースケースから始めます。これらに共通しているのは、データが急速に変化し、ユーザーがリアルタイムで操作を行い、プラットフォームがこれらの要素を円滑に処理する必要があるということです。
SingleStoreは、新鮮なデータを用いた同時実行時のパフォーマンスを第一の原則として構築されているため、検討中の他のベンダーと併せて必ずテストを行ってください。
