Microsoft Hive ODBC Driver是微軟官方為數(shù)據倉庫工具Hive提供的驅動,如果沒有這個驅動,用戶在電腦上連接hive就可能會無法正常使用,有需要的可以下載來使用。
Hive是什么:
hive是基于Hadoop的一個數(shù)據倉庫工具,可以將結構化的數(shù)據文件映射為一張數(shù)據庫表,并提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行運行。 其優(yōu)點是學習成本低,可以通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應用,十分適合數(shù)據倉庫的統(tǒng)計分析。
Hive定義
Hive是建立在 Hadoop 上的數(shù)據倉庫基礎構架。它提供了一系列的工具,可以用來進行數(shù)據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規(guī)模數(shù)據的機制。Hive 定義了簡單的類 SQL 查詢語言,稱為 HQL,它允許熟悉 SQL 的用戶查詢數(shù)據。同時,這個語言也允許熟悉 MapReduce 開發(fā)者的開發(fā)自定義的 mapper 和 reducer 來處理內建的 mapper 和 reducer 無法完成的復雜的分析工作。
Hive 沒有專門的數(shù)據格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允許用戶指定數(shù)據格式。