12 条Apache Pig特征

1. Apache Pig功能

在本章中我们了解Apache Pig的12个最佳特性。 Apache Pig有许多功能,例如易于编程,处理各种类型数据,可扩展性等。 

2.12个Hadoop Pig 特征

有许多Apache Pig功能。 让我们一一讨论:

1542444997829386.png

Top 12 Features of Apache Pig

支持丰富的运算符

其中一个主要优点是,为了执行多个操作,Apache Pig提供了大量的运算符,例如join,sort,filer等。

易于编程

基本上,对于SQL程序员来说,Pig Latin简单易学。 它与SQL类似。 因此,如果你擅长SQL,编写Pig脚本很容易。

优化引擎

Apache Pig中,这些任务会自动优化它们的执行。 因此,程序员因此只需要关注语言的语义。

可扩展性

可扩展性是它最有用的功能之一。用户可以开发自己的功能函数来读取,处理和写入数据。

UDF用户自定义函数

它提供了在Java等其他编程语言中创建用户定义函数的功能。同时,调用或将它们嵌入到Pig Scripts中。

处理各种数据

处理各种数据是易于编程的原因之一。这意味着它会分析各种数据。无论是结构化还是非结构化。此外,它将结果存储在HDFS中。

Join加入操作

在Apache Pig中,执行Join操作非常简单。

多查询方法 (Multi-query)

使用多查询方法。很 大程度上减少了代码的长度。

无需编译

不需要任何编译。由于每个Apache Pig操作符都在内部转换为执行中的MapReduce作业。

可选的Schema

Apache Pig中的数据Shema是可选的。如果没有数据结构Shema,可以存储数据为$ 01,$ 02等。

管道 Pipeline

Apache Pig Latin允许在管道中分割数据

数据流语言

Apache Pig是高效的数据流语言。

12 条Apache Pig特征

发表评论

邮箱地址不会被公开。 必填项已用*标注

2 × = 六

滚动到顶部