内容
1. Apache Pig功能
在本章中我们了解Apache Pig的12个最佳特性。 Apache Pig有许多功能,例如易于编程,处理各种类型数据,可扩展性等。
2.12个Hadoop Pig 特征
有许多Apache Pig功能。 让我们一一讨论:
Top 12 Features of Apache Pig
支持丰富的运算符
其中一个主要优点是,为了执行多个操作,Apache Pig提供了大量的运算符,例如join,sort,filer等。
易于编程
基本上,对于SQL程序员来说,Pig Latin简单易学。 它与SQL类似。 因此,如果你擅长SQL,编写Pig脚本很容易。
优化引擎
Apache Pig中,这些任务会自动优化它们的执行。 因此,程序员因此只需要关注语言的语义。
可扩展性
可扩展性是它最有用的功能之一。用户可以开发自己的功能函数来读取,处理和写入数据。
UDF用户自定义函数
它提供了在Java等其他编程语言中创建用户定义函数的功能。同时,调用或将它们嵌入到Pig Scripts中。
处理各种数据
处理各种数据是易于编程的原因之一。这意味着它会分析各种数据。无论是结构化还是非结构化。此外,它将结果存储在HDFS中。
Join加入操作
在Apache Pig中,执行Join操作非常简单。
多查询方法 (Multi-query)
使用多查询方法。很 大程度上减少了代码的长度。
无需编译
不需要任何编译。由于每个Apache Pig操作符都在内部转换为执行中的MapReduce作业。
可选的Schema
Apache Pig中的数据Shema是可选的。如果没有数据结构Shema,可以存储数据为$ 01,$ 02等。
管道 Pipeline
Apache Pig Latin允许在管道中分割数据
数据流语言
Apache Pig是高效的数据流语言。
12 条Apache Pig特征