A Airflowとは? タスクのスケジューリングとモニタリング 1.簡単に説明すると データのワークフローを自動化するツールである。 タスクの実行順序や間隔を設定可能である。 Pythonでワークフローを定義することができる。 2. 詳細に説明すると Apache Airflowは、タスクのスケジューリ... 2023.08.07 A
A ACID特性とは? データベースが持つべき4つの特性 1.簡単に説明すると データベースが持つべき4つの特性 トランザクションの安全性を確保 矛盾なくデータ操作を行うための基準 2. 詳細に説明すると ACID特性とは、データベースのトランザクションが持つべき4つの基本的な特性を指します。これ... 2023.08.07 A
H HDFSとは? ビッグデータを扱うための分散ファイルシステム 1. 簡単に説明すると ビッグデータを扱うための分散ファイルシステム 大量のデータを複数のマシンに分散して保管 システムの信頼性を確保するための冗長化が特徴 2. 詳細に説明すると HDFSとは、Hadoop Distributed Fil... 2023.08.02 H
M MapReduceとは? 大量のデータを分散処理する技術 1. 簡単に説明すると MapReduceは、大量のデータを分散処理する技術の一つである。 二つの主要なステップ、「Map」と「Reduce」から構成されている。 これにより、計算量が多いタスクでも、多数のマシンで並列に処理することができる... 2023.08.02 M
H Hadoopとは? ビッグデータ処理を行うためのOSS 1. 簡単に説明すると ビッグデータの処理を行うためのオープンソースソフトウェア 分散型ファイルシステムを利用し、大量データの保存と処理が可能 MapReduceという計算モデルを用いる 2. 詳細に説明すると Hadoopは、大量のデータ... 2023.08.02 H
ひ ビッグデータとは? 1. 簡単に説明すると ビッグデータとは、膨大な量のデータのことを指す。 これらのデータは通常のデータベースでは扱えないほど大きい。 データ解析を通じて、新たな知見や価値を引き出すために使われる。 2. 詳細に説明すると ビッグデータとは、... 2023.08.02 ひ