
2025年6月更新:こんにちは。2023年11月にDatabricksのリアルタイム機能とSingleStoreを比較したこのブログ記事を執筆しましたが、先日のLakebaseの発表を受けて更新しました。このブログ記事で「Cassandra」という単語が出てきたら「Neon」に置き換えてください。これでブログは最新版になりました🙂
SingleStore と Databricks はどちらも、顧客の重要な課題に対処する優れたデータ プラットフォームです。
しかし、パフォーマンスとコストに関しては、SingleStore にはいくつかの大きな利点があります。これは、SingleStore がパフォーマンスを徹底的に追求して構築されているため、コスト削減につながるからです。このブログは、これらの違いを検証する複数回シリーズの第1回です。まずは、SingleStore が特に優れているリアルタイム分析と運用について取り上げます。
さらに、SingleStore は、非リアルタイムのバッチ ETL ジョブでもコストとパフォーマンスの面で優れていることがわかりました。これについては、後続のブログで取り 上げる予定です。
リアルタイムデータの価値を理解する
まず、リアルタイムデータの重要性を明確にしましょう。なぜ顧客はそれを重視するのでしょうか?答えは単純です。多くのユースケースにおいて、データの価値は古くなるにつれて低下していくからです。マーケティングキャンペーンの最適化、取引スピードの監視、在庫のリアルタイム更新のプッシュ、ネットワーク障害の監視、セキュリティイベントの監視など、どのような場合でも、顧客からの反応の遅れは金銭的な損失につながります。これらのソースから生成されるイベントは、ストリームとして継続的に到着するため、ストリーミング技術の台頭につながっています。Databricksの最近のブログ「Apache Spark Structured Streamingでレイテンシが1秒未満に」は、この点を的確に表現しています。
多くのお客様との会話の中で、一貫して1秒未満のレイテンシが求められるユースケースに遭遇しました。このような低レイテンシのユースケースは、運用アラートやリアルタイム監視、いわゆる「運用ワークロード」といったアプリケーションから生まれます。
SingleStoreでは、お客様に とって最も重要なのはミリ秒単位であるため、これを品質レイテンシと呼び、1つのイベントがプラットフォームに入り、宛先に到達して価値を生み出すまでの時間と定義します。考慮すべき重要な要素は他にもあり、Databricksはブログ記事で「スループット、コスト、レイテンシのトレードオフをバランスさせる柔軟性をユーザーに提供する」ことを正しく指摘しています。私たちはさらに、シンプルさと可用性という2つの要素を追加することで、理想的なリアルタイムデータプラットフォームの目標を実現します。
- 遅延を最小限に抑える
- スループットを最大化する
- コストを最小限に抑える
- 可用性を最大化する
- シンプルさを最大限に


