Sau lúc đang cùng Cửa Hàng chúng tôi đối chiếu về BigData sống các nội dung bài viết trước, chắc rằng những bạn đã sở hữu ánh nhìn tổng thể nhất về nó rồi bắt buộc không? Trong khi, tương quan mang lại BigData, công ty chúng tôi đã và đang bao gồm nội dung bài viết về technology Hadoop, biết được vẻ ngoài hoạt động của MapReduce, những vận dụng phía bên trong của Hadoop gồm những gì? Và sinh hoạt bài viết tiếp theo này, chúng ta đã cùng cả nhà xem thêm một nguyên tố bên phía trong Hadoop nữa, đó là ngôn ngữ lập trình Hive sầu. Vậy Hive sầu là gì? HiveSQL là gì? khác lại, phong cách xây dựng với giải pháp thao tác làm việc của Hive? Và Ưu điểm của Apabịt Hive sầu là gì? Tất cả đều công bố trên sẽ được chúng tôi phân tích thật kỹ mang đến cho các ban, như thế nào cùng nhau ban đầu nhé!

Ngôn ngữ thiết kế Hive là gì?

*
Ngôn ngữ thiết kế Hive sầu là gì?

Hive sầu chưa phải là một cơ sở dữ liệu theo phong cách quan hệ, không hẳn là một trong kiến tạo nhằm xử lý các thanh toán online (OLTP.. – Online Transaction Processing), và cũng không phải là một trong ngôn ngữ cho những tầm nã vấn thời hạn thực… Mà ngữ điệu xây dựng Hive chính là phương tiện cơ sở hạ tầng để xử lý dữ liệu gồm cấu trúc bên phía trong technology Hadoop. Vị trí của chính nó là vị trí đỉnh của Hadoop để cầm tắt, truy nã vấn và phần tích dữ liệu được thuận tiện hơn. quý khách hàng bao gồm biết, thuở đầu Hive sầu được cải cách và phát triển vì ai ko, vâng, kia chính là gã to con mạng xã hội facebook. Nhưng sau đó, Apabịt đã lấy và cách tân và phát triển thành mã nguồn mngơi nghỉ như bây giờ và khắc tên là Apabịt Hive. Lúc bấy giờ, có không ít đơn vị cùng tập đoàn lớn béo thực hiện Hive, nhỏng Amazon, Alibatía, Nike…

HiveSquốc lộ (giỏi được hotline tắt là HQL) là gì ?

Cũng hệt như Squốc lộ, ngôn ngữ tầm nã vấn Hive sầu cũng cung cấp những toán tử cơ bạn dạng để cách xử lý đại lý tài liệu, HiveSquốc lộ rất có thể tạo với cai quản những tables cùng partitions dễ dãi, ngoài ra, nó cũng cung cấp các tân oán tử Relational, Logical, Arithmetic, Evaluate functions, với những những một số loại toán thù tử không giống nữa. Phương thức buổi giao lưu của HiveSQL là download về nội dung của một table từ thư mục tổng thể hoặc hiệu quả của các câu tầm nã vấn cho tlỗi mục HDFS.

Bạn đang xem: Apache hive là gì

Các chúng ta có thể xem thêm ví dụ sau để dễ nắm bắt rộng (thật thân quen bắt buộc không nào !)

SELECT upper(name), salespriceFROM sales;SELECT category, count(1)FROM productsGROUPhường BY category;

khác thường của Hive

Thứ 1 nó được thiết kế với dành riêng cho OLAP.. Thứ đọng 2: nó lưu trữ các lược trang bị vào cửa hàng dữ liệu và cách xử lý những dữ liệu này bên trong HDFS Thđọng 3: nó cung ứng ngôn từ đẳng cấp SQL để truy tìm vấn cửa hàng dữ liệu được thuận tiện với dễ dãi, và được Điện thoại tư vấn là HiveSquốc lộ (tuyệt HQL) Thđọng 4: cũng chính vì áp dụng ngữ điệu loại Squốc lộ, bắt buộc trông Hive siêu không còn xa lạ, thuận tiện thực hiện hối hả so với những lập trình viên mới bước đầu với đặc biệt có công dụng không ngừng mở rộng.

Ở phần tiếp sau của bài viết, cũng chính là phần khôn cùng quan trọng về Hive, đó đó là phong cách thiết kế cùng giải pháp thao tác làm việc của nó, chúng ta để ý gọi kỹ với trường hợp bao gồm thời cơ thao tác làm việc cùng với nó, hãy thực hành thật các nhé !

Kiến trúc của Hive

Sơ vật tiếp sau đây diễn đạt chi tiết về bản vẽ xây dựng của ngữ điệu lập trình sẵn Hive, các bạn quan lại ngay cạnh thật cẩn thận, kế tiếp chúng ta vẫn cùng mọi người trong nhà đi phân tích một vài yếu tắc thiết yếu của nó nhé!

*
Kiến trúc của ngôn từ thiết kế Hive

Kiến trúc của Hive có không ít yếu tố khác nhau, tuy vậy, gồm 5 yếu tắc chính được áp dụng các tốt nhất dưới đây:

Thành phần quan trọng đặc biệt trước tiên cùng với tên gọi User Interface: Đây chính là hình ảnh người tiêu dùng mà Hive cung cấp, gồm những: Hive sầu Web UI, Hive command line cùng Hive sầu HD Insight, nó giúp tạo ra sự cửa hàng giữa người dùng với HDFS. Thành phần thứ hai. Meta Store: phía trên đó là chỗ mà Hive lựa chọn những máy chủ các đại lý tài liệu để lưu trữ như: những các loại lược thiết bị, những metadata, các cột, các bảng, những nhiều loại tài liệu vào một bảng, một cột và tài liệu ánh xạ của HDFS. Thành phần 3. Hivequốc lộ Process Engine: HiveQL thao tác làm việc tương tự nhe Squốc lộ nhằm truy tìm vấn các thông báo về lược đồ vật trên khối hệ thống. Bên cạnh đó, trên đây còn là một trong những phương thức nhằm mục tiêu sửa chữa thay thế mang lại lịch trình MapReduce. Vì nỗ lực, các thiết kế viên gắng vì yêu cầu viết chương trình MapReduce bởi Java tương đối phức tạp cùng mất không ít thời hạn, thì chúng ta hoàn toàn có thể viết đông đảo câu tróc nã vấn bằng HiveQL để cách xử trí các bước được dễ dãi rộng. Thành phần lắp thêm 4. Execution Engine: đấy là phần phối kết hợp giữa 2 công cụ xử lý: HiveQL + MapReduce, với nó đó là giải pháp tiến hành Hive Execution Engine. Công chũm này góp triển khai cùng giải pháp xử lý các câu truy vấn vấn dữ liệu. Và ở đầu cuối, là yếu tắc sản phẩm 5. HDFS hoặc HBASE: trên đây đó là hệ thống các tệp phân tán của Hadoop. Và HBASE chính là các kỹ thuật dùng để làm tàng trữ dữ liệu vào khối hệ thống các tệp phân tán kia.

Xem thêm: " Ban Hành Tiếng Anh Là Gì, Nghĩa Của Từ Ban Hành Trong Tiếng Việt

Cách thức thao tác của Hive

Quý khách hàng hãy quan lại gần cạnh sơ thiết bị tiếp sau đây, nó diễn tả quy trình thao tác làm việc thân Hive cùng Hadoop.

*
Quy trình thao tác làm việc của Hive sầu cùng Hadoop Cách 1: Thực thi những chiếc lệnh query: giao diện thực hiện của Hive giống hệt như Commvà line, hoặc những đồ họa người tiêu dùng website, gửi truy vấn vấn cho trình điều khiển và tinh chỉnh nhằm tiến hành các cái lệnh Bước 2: Nhận kế hoạch: trình điều khiển với sự hỗ trợ của trình biên dịch, sau đó đối chiếu các cú pháp truy nã cấp cho nhằm soát sổ những cú pháp, các kế hoạch với hưởng thụ truy hỏi vấn. Bước 3: Nhận metadata: các trình biên dịch đã gửi thưởng thức dìm metadata mang lại Metastore. Bước 4: gửi kế hoạch: các trình biên dịch sau khoản thời gian chất vấn thật kỹ càng những kinh nghiệm vẫn gửi lại chiến lược mang đến trình tinh chỉnh và điều khiển xử lý tiếp. Và đến trên đây, thì Việc đối chiếu cú pháp và biên dịch một tróc nã vấn đã làm được hoàn toàn. Bước 5: Thực hiện nay kế hoạch: trình tinh chỉnh đang gửi planer nghỉ ngơi bên trên cho những lý lẽ thực thi. Cách 6: Thực xây dựng việc: MapReduce sẽ có được trách nhiệm tiến hành những công việc bên trên. Công thế này đã gửi công việc cho các JobTracker làm việc bên trong node Name, tiếp đến nó gán công việc này cho những TaskTracker. Bước 7: các buổi giao lưu của metadata: vào quy trình thực hiện, những lý lẽ thực hiện vẫn thực thi những buổi giao lưu của metadata cùng với Metastore. Cách 8: Lấy kết quả: các cách thức thực hiện đang đem công dụng từ bỏ các node Data Bước 9: Gửi kết quả: sau khoản thời gian tiến hành ngừng, các phương tiện đã gửi hiệu quả mang lại trình tinh chỉnh và điều khiển, ở đầu cuối, các trình tinh chỉnh và điều khiển đang gửi toàn bộ công dụng giải pháp xử lý được cho giao diện Hive sầu. Cách 10: các lập trình viên có thể sử dụng các tác dụng được gửi mang đến Hive sầu nhằm Giao hàng đến quá trình của mình cùng kết thúc quá trình xử trí tài liệu tiếp sau.

Xem thêm: Số Tham Chiếu Là Gì ? Tuyệt Chiêu Số Tham Chiếu: Ups

Trên đấy là toàn thể những thức làm việc của ngôn ngữ xây dựng Hive sầu, với ở phần cuối của nội dung bài viết này, bọn họ sẽ bài viết liên quan phần đông điểm mạnh quá trội của Apabịt Hive, vươn lên là nó đổi mới một nguyên lý cung cấp tâm đắc tốt nhất của khối hệ thống Hadoop.

Những điểm mạnh quá trội của Apache Hive

Nó là một trong cửa hàng tài liệu SQL thực, cùng với cỗ tài liệu rất to lớn. Nó được tích hợp hiện tượng BI, những ngôi trường áp dụng EDW, bảng ACID, mà hơn nữa nó còn tích hòa hợp cả Hbase góp xử lý thông báo, tài liệu đúng đắn và nhanh chóng hơn. Nó hỗ trợ Spark trẻ khỏe, địa chỉ giỏi với Druid, mà còn với lý lẽ bảo mật tài liệu mạnh mẽ, Apache Hive sẽ giúp đỡ ích không hề ít cho các lập trình sẵn viên trong vụ việc bảo mật công bố người tiêu dùng. Apabịt Hive cung cấp lưu trữ các các loại tệp tài liệu khác nhau trên HDFS gồm những: Apache ORC, Apađậy Parquet, CSV, JSON, ACID Kết hợp Squốc lộ bên trên Hadoop (HPL và SQL)Những bài viết kỹ năng và kiến thức thiết kế thuộc chủ đề: