<>背景

我最爱的师姐今年入职然后内推本人
官网秋招刚开的第2天就投了,三四天之后收到测评,就是性格测试那些,不需要怎么准备,很简单的
测评过后不久收到了一面邀请

<>面试过程

1、自我介绍

2、你认为最成功的一个项目是什么?
答:目前正在进行中的这个项目,然后具体描述了一番
2.1 深挖项目 – 用什么语言?
2.2 用了什么数据结构方法? 答: DFS + 一些NLP的方法(BM25)
2.3 返回的东西是什么? 答: json字符串
2.4 解释一下BM25? 答:选取reference中词频小的词组作为该字段的关键词
2.5 为什么选择BM25不选择TF-IDF? 答:主管叫我用BM25
【其实这个地方应该答BM25比TF-IDF多算的一个权重,词组在自己query中的词频】

3、说说SQL中rank 、dense_rank、row_number三者的区别?
答:答了他们都是开窗函数,开窗函数是怎么用的,还有他们之间计算结果的区别。还附送了开窗函数和聚合函数的区别,以及我在使用这两种函数中遇到的一些坑

4、业务题 – 有一个零食店在上海要选址,作为数据分析你需要选取哪些指标然后怎么做出选址决策?

答:从收入和支出两个方向考虑,有不同地区的地租、店面面积、人力成本作为该地区的支出指标,收入指标也瞎说了一些,然后说了一些onehot的变量,例如是否在学校周边?是否在居民区周边?之类的
这一段就是 我疯狂提出指标,面试官疯狂否定
怀疑人生5555
(这期间他还信号不好然后掉出去了一次2333)

5、反问
就问了常规的业务体系和主要工作内容
面试官答:这个岗位有很多方向,可以根据你自己喜欢的方向去到合适自己的方向;举例:商业分析+特征工程方向,数据挖掘方向、数据研发-数据仓库方向
感觉就是SQL民工2333

<>面试感受

面试官人很好,遇到不会或者卡壳的地方会想办法引导
但是对于答案跟标准答案(或者他希望我答得)不一样得情况他也会直接指出说你这样的想法不全面或者理解有误之类的
总的而言是我太菜了55555

面试进度:3/50

技术
下载桌面版
GitHub
Gitee
SourceForge
百度网盘(提取码:draw)
云服务器优惠
华为云优惠券
腾讯云优惠券
阿里云优惠券
Vultr优惠券
站点信息
问题反馈
邮箱:[email protected]
吐槽一下
QQ群:766591547
关注微信