大数据工程师面试什么(睿民大数据开发岗位面试题)

笔试题

大数据工程师面试什么(睿民大数据开发岗位面试题)(1)

1.在E-R图中,实体、属性、关系分别用什么代表(B)

A、矩形、菱形、椭圆 B、矩形、椭圆、菱形

C、椭圆、菱形、矩形 D、圆、矩形、菱形

2.在项目开发概要设计阶段,数据库设计主要完成的工作是()

A、标识关键对象 B、确定对象之间关系

C、绘制E-R图 D、将E-R图转换为表

3、给变量赋值是可以采用()方式

A、SELECT B、PRINT C、SET D、=

4、T-SQL中输出的语句是()

A、PRINT B、WRITE C、SELECT D、SET

5、关于SQL的变量,说法正确的是()

A、定义局部变量的语法:declare数据类型@标识符

B、给局部变量赋值可以使用set,得到其值可以用get

C、SQL的系统全局变量用法:在某个数据库中改变其值,在另一个数据库仍可读取

D、SQL可以定义全局变量,但其用法和局部变量差不多

6、()作为批处理结束标志

A、RETURN B、QUIT C、GO D、EXIT

7、下面那个排序函数生成的序号是非连续的()

A、ROW_NUMBER B、RANK C、DENSE_RANK D 、ROW_ID

8、下列关于子查询的方法正确的是()

A、查询是可以放在父查询的where后,但无法在select和from中间

B、子查询在查询条件中使用,“>”、“<”、”=“符号后的子查询结果只能有一个值

C、子查询可以嵌套,但最多不能超过3层

D、如果子查询放在父查询中对父查询的语法结构不产生影响,那么子查询可以省略外面的小括号

9、在一个表中最多会有几个聚集索引()

A、1 B、2 C、3 D、4

10、下列()条语句用于事务回滚

A、rollback B、commit C、rollback transaction D、commit transaction

11、下列()语句用来定义可以随意滚动的游标

A、DECLARE cursor_name CURSOR SCROLL

B、DECLARE cursor_name SCROLL CURSOR

C、DECLARE cursor_name CURSOR

D、DECLARE cursor_name SCROLL

12、以下关于INSTEAD OF触发器说法正确是()

A、INSTEAD OF触发器是出于DDL触发器这一类的一种

B、INSTEAD OF触发器可以和引发该触发器操作的INSERT、UPDATE、DELETE语句一起,共同对表的数据产生影响

C、INSTEAD OF触发器是替代引发该触发器操作的INSERT、UPDATE、DELETE语句,转而让系统执行该触发器内部的T-SQL代码的

D、INSTEAD OF触发器不能创建在视图上

13、SQL的视图中最多可以包含()列

A、256 B、512 C、1024 D、2048

14、加密试图的定义文本可以使用( )

A、WITH CHECK OPTION

B、WITH SCHEMABINDING

C、WITH NOCHECK

D、WITH ENCRYPTION

15、系统存储过程以()为前缀

A、@@ B、@ C、sp_ D、up_

SQL题目:

Dept表

deptno(部门号) dname(部门名称)

1 事业部

2 销售部

3 技术部

Emp表

empno(员工号) ename(员工名称) job(工作) mjr(上级) sql(工资) deptno(部门名称)

01 test clerk tom 1000 1

02 tom clerk 2000 1

07 bid clerk 1000 1

03 jen salse pre 600 2

04 pre salse 800 2

05 bud jishu can 1200 3

06 can jishu 1500 3

1、列出emp中各部门的部门号、最高工资、最低工资

2、列出emp中各部门job为clerk的员工最高和最低工资

3、列出bud所在部门中所有员工的名称及部门号

4、列出emp中有管理者的员工,列出员工姓名、管理者姓名(mgr为外键)

5、对于工资高于本部门平均水平的员工,列出部门号、姓名、工资、按照部门号升序

6、对于emp中低于自己工资至少5人,列出部门号、姓名、工资、以及工资少于自己

的人数

选择:N/15 sql题:N/6

数据表: dept: deptno(primary key), dname, loc emp: empno(primary key), ename, job, mgr(references emp(empno)), sal, deptno(references dept(deptno))

大数据工程师面试什么(睿民大数据开发岗位面试题)(2)

1 列出emp表中各部门的部门号,最高工资,最低工资select max(sal) as 最高工资,min(sal) as 最低工资,deptno from emp group by deptno;

2 列出emp表中各部门job 含’REP’的员工的部门号,最低工资,最高工资select max(sal) as 最高工资,min(sal) as 最低工资,deptno as 部门号 from emp where job like '%REP%' group by deptno;

3 对于emp中最低工资小于7000的部门中job为'SA_REP'的员工的部门号,最低工资,最高工资select max(sal) as 最高工资,min(sal) as 最低工资,deptno as 部门号 from emp bwhere job='SA_REP' and 7000>(select min(sal) from emp a where a.deptno=b.deptno) group by b.deptno

4写出对上题的另一解决方法(请补充)

select deptno,min(sal),max(sal) from emp where job = 'SA_REP' and deptno in ( select deptno from emp --group by deptno having min(sal) < 7000 ) group by deptno

5根据部门号由高而低,工资由低而高列出每个员工的姓名,部门号,工资select deptno as 部门号,ename as 姓名,sal as 工资 from emp order by deptno desc,sal asc

6 列出'Abel'所在部门中每个员工的姓名与部门号select ename,deptno from emp where deptno = (select deptno from emp where ename = 'Abel')

(法二)

select ename,deptno from emp e1 where exists ( select 'x' from emp e2 where e1.deptno = e2.deptno and e2.ename = 'Abel' )

7 列出每个员工的姓名,工作,部门号,部门名select ename,job,emp.deptno,dept.dname from emp,dept where emp.deptno=dept.deptno

8 列出emp中工作为'SH_CLERK'的员工的姓名,工作,部门号,部门名select ename,job,dept.deptno,dname from emp,dept where dept.deptno=emp.deptno and job='SH_CLERK'

9 对于emp中有管理者的员工,列出姓名,管理者姓名(管理者外号为mgr)select a.ename as 姓名,b.ename as 管理者 from emp a,emp b where a.mgr is not null and a.mgr=b.empno

10 对于dept表中,列出所有部门名,部门号,同时列出各部门工作为'SH_CLERK'的员工名与工作select dname as 部门名,dept.deptno as 部门号,ename as 员工名,job as 工作 from dept,emp where dept.deptno = emp.deptno( ) and job = 'SH_CLERK'

11 对于工资高于本部门平均水平的员工,列出部门号,姓名,工资,按部门号排序select a.deptno as 部门号,a.ename as 姓名,a.sal as 工资 from emp awhere a.sal>(select avg(sal) from emp b where a.deptno=b.deptno) order by a.deptno

(法二)

select e.deptno,ename,sal from emp e,(select deptno,avg(sal) avg_sal from emp group by deptno) b where e.sal > b.avg_sal and e.deptno = b.deptno

12 对于emp,列出各个部门中工资高于本部门平均水平的员工数和部门号,按部门号排序select count(a.sal) as 员工数,a.deptno 部门号 from emp awhere a.sal>(select avg(sal) from emp b where a.deptno=b.deptno) group by a.deptno order by a.deptno

13. 对于emp中工资高于本部门平均水平,人数多于1人的,列出部门号,高于部门平均工资的人数,按部门号排序

select * from( select deptno,count(*) count_num from emp e where sal > ( select avg(sal) from emp e1 where e.deptno = e1.deptno ) group by deptno ) e1 where e1.count_num > 1 order by e1.deptno

14 对于emp中工资高于本部门平均水平,且其人数多于3人的,列出部门号,部门人数,按部门号排序select count(a.empno) as 员工数,a.deptno as 部门号,avg(sal) as 平均工资 from emp awhere (select count(c.empno) from emp c where c.deptno=a.deptno and c.sal>(select avg(sal) from emp b where c.deptno=b.deptno))>3group by a.deptno order by a.deptno

(法二)

select m.deptno,count(ee1.empno) from( select e1.deptno,count(empno) count_num from emp e1 where e1.sal > (select avg(sal) from emp e2 where e1.deptno = e2.deptno) group by e1.deptno ) m,emp ee1 where m.count_num > 3 and m.deptno = ee1.deptno group by m.deptno

15 对于emp中低于自己工资至少5人的员工,列出其部门号,姓名,工资,以及工资少于自己的人数select a.deptno,a.ename,a.sal,(select count(b.ename) from emp as b where b.sal<a.sal) as 人数 from emp as awhere (select count(b.ename) from emp as b where b.sal<a.sal)>5

面试题

(1)hdfs小文件解决方案,

(2)kafka有关的一些问题,

(3)sparkstreaming手动维护偏移量

(4)sparkshuffle问题

(4)sqoop的问题

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页