zhizhesoft

  • 首页
Impala
Hive

大叔经验分享(106)Impala读取parquet时间字段时区偏移问题

parquet文件中的时间字段,在hive和spark-sql中读取正常,在impala中读取会偏移8个小时(少),经测试结果如下: 一 不修改impala配置 1 由spark或hive写入parquet spark和hive读取正常 impala读取偏移8小时(少),需要手工偏移 from_unixtime(unix_timestamp(time) + 28800) 二 修改impala配置 use_local_tz_for_unix_timestamp_conversions=true convert_leg…

2022年7月29日 0条评论 16点热度 0人点赞 risingsun 阅读全文
BigData

大叔经验分享(136)impala支持orc查询

impala从3.1版本开始支持orc格式查询,不过是experimental 开启方法,在cdh的impala配置中添加 --enable_orc_scanner=true 然后重启impala集群。 官方文档: https://docs.cloudera.com/documentation/enterprise/latest/topics/impala_orc.html

2022年7月29日 0条评论 13点热度 0人点赞 risingsun 阅读全文
BigData

大数据基础之Impala(2)实现细节

一 架构 Impala is a massively-parallel query execution engine, which runs on hundreds of machines in existing Hadoop clusters. It is decoupled from the underlying storage engine, unlike traditional relational database management systems where the query processing…

2022年7月29日 0条评论 13点热度 0人点赞 risingsun 阅读全文
hdfs

大叔问题定位分享(38)impala报错内存不足

impala有时查询报错内存不足,并持续一段时间后自动恢复,报错时日志如下: org.apache.hive.service.cli.HiveSQLException: ExecQueryFInstances rpc query_id=834c3b2376181f0e:a901620f00000000 failed: Failed to get minimum memory reservation of 204.00 MB on daemon 192.168.0.1:22000 for query 834c3b23…

2022年7月29日 0条评论 11点热度 0人点赞 risingsun 阅读全文
BigData

大叔经验分享(83)impala执行多个select distinct

impala在一个select中执行多个count distinct时会报错,比如执行 select key, count(distinct column_a), count(distinct column_b) from test_table group by key 会报错 Query submitted at: 2019-09-28 00:34:20 (Coordinator: http://DataOne-001:25000)ERROR: AnalysisException: all DISTINCT ag…

2022年7月29日 0条评论 30点热度 0人点赞 risingsun 阅读全文
BigData

大数据基础之Impala(1)简介、安装、使用

impala2.12 官方:http://impala.apache.org/ 一 简介 Apache Impala is the open source, native analytic database for Apache Hadoop. Impala is shipped by Cloudera, MapR, Oracle, and Amazon. impala是hadoop上的开源分析性数据库;C++和java语言开发; Do BI-style Queries on Hadoop Impala provi…

2022年7月29日 0条评论 15点热度 0人点赞 risingsun 阅读全文
Ambari

大数据基础之Ambari(4)通过Ambari部署Impala

ambari2.7.3(hdp3.1) 安装 impala2.12(自动安装最新) ambari的hdp中原生不支持impala安装,下面介绍如何通过mpack方式使ambari支持impala安装: 一 安装Service 1 下载 # wget https://github.com/cas-bigdatalab/ambari-impala-service/raw/master/ambari-impala-mpack-2.6.0-0816.tar.gz 2 安装  # ambari-server install-…

2022年7月29日 0条评论 14点热度 0人点赞 risingsun 阅读全文
BigData

大数据基础之Kerberos(2)hive impala hdfs访问

1 hive # kadmin.local -q 'ktadd -k /tmp/hive3.keytab -norandkey hive/[email protected]'# kinit -kt /tmp/hive3.keytab hive/[email protected]# klist # beeline -u 'jdbc:hive2://192.168.0.3:10000/;principal=hive/[email protected]'# hive 注意这里的server03是指hive server的…

2022年7月29日 0条评论 23点热度 0人点赞 risingsun 阅读全文
Benchmark

大数据基础之Benchmark(4)TPC-DS测试结果(hive/hive on spark/spark sql/impala/presto)

1 测试集群 内存:256GCPU:32Core (Intel(R) Xeon(R) CPU E5-2640 v3 @ 2.60GHz)Disk(系统盘):300GDisk(数据盘):1.5T*1 2 测试数据 tpcds parquet 10g tpcds orc 10g 3 测试对象 hive-2.3.4 【set mapreduce.map.memory.mb=4096; set mapreduce.map.java.opts=-Xmx3072m;】【yarn 200g*3】 hive-2.3.4 on sp…

2022年7月29日 0条评论 28点热度 0人点赞 risingsun 阅读全文
BigData

大叔经验分享(48)oozie中通过shell执行impala

oozie中通过shell执行impala,脚本如下: $ cat test_impala.sh #!/bin/sh /usr/bin/kinit -kt /tmp/impala.keytab impala/server04 /usr/bin/impala-shell -i server04:21000 -q 'show databases' 直接执行shell脚本正常,在oozie中执行报错: Traceback (most recent call last): File "/usr/lib/impala-she…

2022年7月29日 0条评论 19点热度 0人点赞 risingsun 阅读全文
12345…16
Search

COPYRIGHT © 2022 zhizhesoft. ALL RIGHTS RESERVED.