设为首页 加入收藏

TOP

浪叫兽的自我介绍 (完整版) 讲述一段如何进入大数据行业(一)
2017-10-09 16:55:46 】 浏览:8343
Tags:自我 介绍 整版 讲述 如何 进入 数据 行业

大家好,我是智浪淘沙,在大数据比赛的圈子里大家喜欢称呼我为浪叫兽。

我先做一个简单的且不如意的人生轨迹介绍把,出生农村的我,对自己的才智一直是很自信的。可能是由于自己的天性,不会表达自己加不会按部就班的喜欢上学习,我小学和初中都默默无闻,成绩也不怎么理想,但是始终好着面子,依然是觉得自己很聪明,自己以后能干些大事。而时常被考分的现实所打击。进入高中后,人开始长高了,人也帅气了一点点,玩心也大了,学了学校的美术,音乐,播音主持,体育的专业课,其中美术可能是一个星期,播音主持半学期,音乐半学期,体育好像一直到高三,但是没报专业考试。当过学生会主席,还有班长。高中很开心的过去了,高考也和最后一年的意料之内的事情一样,黄了。

毕业之后去了北京某某培训机构,学了两年的Linux运维,但是苦于性格放不开,年纪太小,当时还很排斥90后,当然还有学历太低,在北京处于很尴尬的地步,并没办法在北京落脚。

10年在深圳,做过销售,做过简单的电脑维护,12年回到长沙开上了图文店,每天起早贪黑,超过十二个小时的个体户工作,身心疲惫,萌生了再次进入职场的念头,15年在朋友的介绍下进入了电网系统内的一家运维单位,做网络运维,可以简单称为网管把。

15年入职网管,我内心是很激动的,终于踏上了梦寐以求的职场,认识了很多热心的同事,并且接触了很潮流的名词,股票投资,并学了假的波浪理论,假的缠论,假的量能理论,并花了2W了的学费,戒掉了股票投资。

一切从浪叫兽开始。

钱输了,人却没因此放弃对技术的研究,萌生了想法,希望通过爬虫抓取股票的新闻,来分析新闻可能对股票产生某些信号。16年4月份在爬虫群里遇到了我Python的第一个老师,大鱼,我亲切的喊他为鱼神。在玩Python爬虫的同时,我学会了简单的flask 和echart。

对于从来不会Python的我,几个星期的学习下来,从Python爬虫,到将数据入库,还有用js的网页方法展示股票数据,就这样简单的完成了。激发了我对Python编程的爱好。

由于需要对数据进行处理,在Python的环境下需要学习一个叫pandas的库操作,我加入到了pandas群,遇到了人生中的启蒙叫兽,牛叫兽,在牛叫兽的耐心指导之下,我pandas的使用,还算很融会贯通了,因为我的提问多,短短的一个月,我就在pandas群里获得了叫兽的称呼,叫兽是QQ群的一种积分排名,刚刚好发言最多的人被称为叫兽,后面在网友chengxu等人的玩笑话之间,叫兽在我建的新群中继续得到了延续。

我喜欢被人称为浪叫兽,因为这是一个比较活跃的人才能在群里取得的头衔,在我看来我是多么的热爱学习才能获得这样的头衔。

当初牛叫兽说他想学机器学习,当时我很羡慕他的工资待遇,1W2左右把,在上海可能不高,但是对于在长沙待遇只有4000左右的我来说,却显得那么的遥不可及。

既然牛叫兽说他想学机器学习,那我就跟他一起学呗,我们建了一个群,并找了学习资料开始学习起来,当初我下载过一份黄博的机器学习笔记,并加入了他的群。在建群后我就在黄博的群里,拉了20多个朋友,加入了学习机器学习的生涯。

学了一个月左右把,群里的mat,说群主你这么好学,不如去玩玩比赛,然后他就发了科赛的网址,正好遇到了我人生中的第一场比赛,携程赛。

第一次比赛的我其实很逗比,没有使用过sklearn,xgboost,lgb,各种算法也只在一个月中看过概率图模型,统计学习方法,数学建模算法大全了解过一些基本知识。

上一个月和牛叫兽,chengxu,Silence,在群里交流的都是一些算法上的简单理解,还有hadoop,pyspark,sql。

还好Silence曾经玩过滴滴的比赛,好像排名还很靠前,只是因为要考英语证书,没时间指导我。我就厚脸皮的在携程赛的群里,不惧他人的嘲笑,用简单的散点图,和柱状图在群里用我的理解分析数据,并在交流的过程中认识到了,李老师,钢的弦,世超,等等热心的伙伴。

依稀记得当时有yesboy(荣获“猜你喜欢”比赛冠军),说他使用的xgboost算法,在携程赛中获得了前5的地位,对我来说xgboost是一个陌生的名词。

很多新人安装xgboost都要折腾半个月之久,我想都是不善于自己动手把,或者没人指导安装,勤劳好学的我,只花上了一天的功夫,安装好了git,mingw,编译xgboost,安装xgboost,并测试安装成功。无非就是在网上多搜索了一些文档把。

安装完成xgboost,他不过是一个冰冷的库,当时也很厌倦去网上搜索使用教程,不过说实在的,网上的教程也不是讲的携程赛的数据上怎么用,那就伸手党做一下把。

切换到黄博群里,黄博群里有一个,人称海淀吴彦祖,据说是玩kaggle的,猜想xgboost对他来说肯定很容易,这人一定很牛叉,果不然,我向他提问xgboost怎么玩,他也耐心的指导我,要调好参数,可是我是一脸蒙逼的问不下去问题,我压根没玩过,我怎么知道什么是参数,后面他的一句话让我在整个比赛生涯中都留下了思考,他说这一切都是套路。

Silence恰好有时间来玩比赛了,当时和世超,李老师(五个月就拿下了天池的数据科学家)mat,纳蓝,钢的弦,组了携程赛的小交流群,大家都很友善的指导我这个新人,一起交流学习,而正当此时,破特曼,以0.17 的bug成绩霸了携程赛的榜,好像又发现了一个新的大牛,便和他纠缠起来,请教他怎么弄的那么高的分,心有不甘把,为啥人家能这样高的分,我却不能,便在找到了海淀吴彦祖指导,我说xgboost的简单使用我已经会了,能不能在教教其它的,在不经意之间发现,海淀吴彦祖和破特曼居然是队友。

终究是抱团打战的,不过世超最后也挤进了排行榜前十,钢的弦和yesboy也在前五了。

再次遇到超强组合是在今日头条上面,携程赛完了,比赛的热情却没有熄灭,在群里他们说今日头条赛是yin叔和老王的约战赛,当时想这两个人又是谁,既然能约战,那就有华山论剑的精彩,那就去凑凑热闹 ,报名了今日头条赛。

下载了今日头条数据,我始终排名在100多名,始终还是找不到数据挖掘的关键。

在mat的带领下,我加入了DC一群,看到了老王开源的规则代码,在交流规则代码的过程中,也在群里认识了苍老师,yin叔,和一些群友。

我当时并看不懂R,而牛叫兽在公司已经完成了hadoop的学习,并开始学习R做统计方面的学习,下载了老王的规则代码,便要牛叫兽帮忙翻译了R代码,翻译之后提交了答案,发现居然跑到了前30名,瞬间觉得老王好牛叉,简单的两三句代码居然能让我突破那么多。

对老王萌生了仰慕之情,不过那都是想多学点技术了。

不过30,名有啥用,海淀吴彦祖和破特曼的组合都已经前十了。我和他们的差距真的太大了。

竞赛圈子说大很大,我从来不知道数据挖掘能有这样多的高手,在一直关注着比赛,而且此时我身边都是很多本科生,很多研究生,还有博士生了。

我不知道这意味着什么,但是仔细思考。我和他们的差距实在是太大了,不过我也坚信,我和他们一起交流,能有所收获,我要做的就是和携程赛一样,敢于交流我的想法,敢于和技术高的交流,在今日头疼赛中,我就继续保持了携程赛的风格了,便和知落,东哥,等等小伙伴,一起交流数据挖掘技术,并知道了交叉验证,网格搜索调参,还在知道了多模型融合,不过了解这些技术也并没有让我

首页 上一页 1 2 3 下一页 尾页 1/3/3
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Python中的内建函数(Built_in Fu.. 下一篇python生成式的send()

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目