大数据基础面试题考点与知识点整理

  发布时间:2019-09-09 15:11:05   作者:菜鸟级的IT之路   我要评论
这篇文章主要介绍了大数据基础面试题考点与知识点,总结整理了大数据常见的各种知识点、难点、考点以及相关注意事项,需要的朋友可以参考下

1.分布式的三种模式

 

2.Hadoop集群的运行模式

Hadoop的运行模式分为3种:

本地运行模式(独立模式,单机模式),

伪分布运行模式,

集群运行模式(完全分布式模式)

伪分布模式就是在一台服务器上面模拟集群环境,但仅仅是机器数量少,其通信机制与运行过程与真正的集群模式是一样的,hadoop的伪分布运行模式可以看做是集群运行模式的特殊情况。

3.cloudera提供哪几种安装CDH方法

· Cloudera manager

· Tarball

· Yum

· Rpm

其中Yum及Rpm安装可以算作一种安装方式

4.Hadoop的模块有哪些

 

5.Zookeeper的作用

 

6.Shuffle在MapReduce指的是什么?

 

7. resourceManager在YARN中的作用

 

8. 将打好的jar包,提交给YARA运行,请写出命令

 

9. 在完全分布式中,将副本数设置为7,在哪个配置文件中,如何配置

 

10. 如何确定map个数

 

11. MapReduce在hadoop中的作用

 

12. MapReduce分为哪两个阶段

 

13. Hadoop的序列化接口是什么

 

14. 自定义的MapReduce如何向yarn提交运行

 

15. 自定义MapReduce的模型

 

16. 简述HDFS的作用

 

17. 在HDFS的主从架构中,谁是“主”

 

18. 简述namenode和DataNode的区别及关系

 

19. 如何将用户hadoop家目录下的1.log,上传到HDFS的 /input目录下,请写出命令

 

 

20. 请回答secondaryNameNode在HDFS的作用

 

21. 把下面的语句用hive方式实现

 

 

 

22. Hive的特点是什么?Hive和rdbms的异同?

 

23. metastore是什么

 

24. Hive有哪些方式保存数据,各有哪些特点

 

25. Hive的本质是什么

 

 

====================================================================

 

1. 搭建伪分布式hadoop开发环境

1、Linux环境

2、Jdk安装

3、 关闭防火墙

4、配置hadoop

5、格式化namenode(不需要重复)

6、启动hdfs 守护进程

7、Web 访问界面  50070

8、配置YARN任务调度

9、启动hdfs YARA进程

10、检查YARN状态

11、向YARN提交任务

2. 编写代码测试HDFS API

 

 

3. 编写MapReduce程序,实现wordcount的功能

 

 

 

 

4. 实现编程测试数据的统计

 

 

 

5. 搭建hadoop完全分布式简单步骤

1、虚拟机装备

2、网络配置完好

3、JDK安装

4、Ssh 配置

5、同步服务器时间

6、Hadoop集群配置

A:环境变量

B:hadoop文件配置,修改

 

7、启动hadoop集群

8、Web端口访问。

6. 编写MR统计分省PV及脏数据

 

 

 

7. hive的安装和使用

 

8. Hive架构,分三个部分来讲解,最好通过画图理解

 

 

9. 为什么说hive是hadoop的数据仓库,从【数据存储和分析】方面理解

 

10. Hive能做什么,与MapReduce相比较优势在哪(对于开发者)

 

相关文章

  • BAT面试中的大数据相关问题笔记

    这篇文章主要介绍了BAT面试中的大数据相关问题,涉及大数据相关的概念、原理、知识点与算法等问题,需要的朋友可以参考下
    2019-08-30
  • BAT大数据面试题与参考答案小结

    这篇文章主要介绍了BAT大数据面试题与参考答案,总结分析了大数据常见的各种知识点、疑难问题与参考答案,需要的朋友可以参考下
    2019-08-16
  • 百度面试算法题目与参考答案总结

    这篇文章主要介绍了百度面试算法题目与参考答案,总结分析了位图、排序、链表、二叉树等操作的原理与相关实现技巧,需要的朋友可以参考下
    2019-09-06
  • 华为笔试算法面试题与参考答案分析【基于C++】

    这篇文章主要介绍了华为笔试算法面试题与参考答案,结合实例形式分析了基于C++的字符串转换、判断、排序等算法相关操作技巧,需要的朋友可以参考下
    2019-09-05
  • 阿里常用Java并发编程面试试题总结

    这篇文章主要介绍了阿里常用Java并发编程面试试题,总结分析了java并发编程的概念、原理、常见操作与相关注意事项,需要的朋友可以参考下
    2019-09-04
  • 两道阿里python面试题与参考答案解析

    这篇文章主要介绍了两道阿里python面试题与参考答案,结合具体实例形式分析了Python数组创建、遍历、拆分及随机数等相关操作技巧,需要的朋友可以参考下
    2019-09-02
  • 银行java开发笔试面试题13道(含答案)

    这篇文章主要介绍了银行java开发笔试面试题13道,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-08-27
  • 腾讯前端面试题相关知识点集锦

    这篇文章主要介绍了腾讯前端面试题相关知识点,整理总结了腾讯前端面试中所涉及的相关基础知识点与疑难问题,需要的朋友可以参考下
    2019-08-27
  • 网络工程师面试时喜欢问的问题与参考答案集锦

    这篇文章主要介绍了网络工程师面试时喜欢问的问题与参考答案,涉及相关网络概念、疑难问题与解决方法,需要的朋友可以参考下
    2019-08-23

最新评论