<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    草狼

    在努力、磨練、打擊下不斷地向著理想的財(cái)務(wù)自由方向前進(jìn)

    數(shù)據(jù)挖掘(Data Mining)時下是一個很流行的詞語,網(wǎng)上隨便搜搜便有成把成把的文章為你講述它的起源、發(fā)展等歷史。
    至于這個行業(yè)真正落地的應(yīng)用個人認(rèn)為在每個行業(yè)都不一樣,我做過互聯(lián)網(wǎng)行業(yè),電信移動,銀行的也看過,記錄一下我的體會和感受?;ヂ?lián)網(wǎng)領(lǐng)域,這些年在 google的帶領(lǐng)下,技術(shù)日益飛進(jìn),真是3天不學(xué)習(xí)就感覺落后了,在這樣進(jìn)步的情況下,必然伴隨著行業(yè)的激烈競爭,有一些公司開始做數(shù)據(jù)挖掘,畢竟沒有競爭的挖掘做完了也不會有人用,就算用了,也不會重視你,這點(diǎn)我在移動的感覺非常深刻,了解互聯(lián)網(wǎng)做數(shù)據(jù)挖掘的情況最好就是先去看看各個公司招人的情況,一般這樣會直接暴露出公司想做的方向,深入的思考就會得到很多信息,這里列舉一個比較有名的互聯(lián)網(wǎng)公司的招聘信息:
    數(shù)據(jù)挖掘工程師
    崗位職責(zé):
    1.負(fù)責(zé)數(shù)據(jù)挖掘領(lǐng)域的分析研究,包括數(shù)據(jù)挖掘算法的分析研究,特定工程的數(shù)據(jù)挖掘模型的需求分析、建模、實(shí)驗(yàn)?zāi)M;
    2.負(fù)責(zé)數(shù)據(jù)挖掘系統(tǒng)的開發(fā),包括需求分析、系統(tǒng)設(shè)計(jì)、系統(tǒng)測試和優(yōu)化。
    任職資格:
    1.計(jì)算機(jī)或數(shù)學(xué)相關(guān)專業(yè)畢業(yè),碩士以上學(xué)歷;有數(shù)據(jù)挖掘2年以上的研究或數(shù)據(jù)挖掘項(xiàng)目實(shí)施經(jīng)驗(yàn);
    2.3年以上的Oracle數(shù)據(jù)庫的應(yīng)用軟件開發(fā)經(jīng)驗(yàn),非常熟悉Oracle存儲過程腳本編寫,熟悉PL/SQL的開發(fā)技術(shù),良好的SQL開發(fā)和調(diào)優(yōu)優(yōu)化技能;
    3.3年以上數(shù)據(jù)挖掘 / 數(shù)據(jù)倉庫 / ETL相關(guān)工作經(jīng)驗(yàn), 具有深厚的統(tǒng)計(jì)學(xué)、數(shù)學(xué)、人工智能和數(shù)據(jù)挖掘知識基礎(chǔ);
    4.熟悉海量數(shù)據(jù)處理和挖掘的基本算法,有電信或者教育行業(yè)數(shù)據(jù)挖掘、多維分析項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;
    5.熟悉互聯(lián)網(wǎng)應(yīng)用,具備Web Service知識,熟悉Spring,Struts等框架;
    6.優(yōu)秀的JAVA/J2EE編程能力,能夠使用JAVA獨(dú)立實(shí)現(xiàn)復(fù)雜的算法結(jié)構(gòu);熟悉C/C++/Perl/python更佳;
    7.快速的學(xué)習(xí)和研究能力,良好的溝通能力及團(tuán)隊(duì)協(xié)作能力。
    從上面不難看出點(diǎn)問題,這不是招人,這是在暴露自己的問題,第一公司想招人的目的性不明確,想做什么也不明確,我們對這個招聘做一個分析,簡單的分析。
    首先看Coding能力,會Java,這個不難,市場上人很多,但是能實(shí)現(xiàn)獨(dú)立的算法結(jié)構(gòu),這不僅僅指簡單的算法,數(shù)據(jù)結(jié)構(gòu)什么的,要實(shí)現(xiàn)的是很多復(fù)雜的數(shù)學(xué)計(jì)算式、決策樹變種、聚類、關(guān)聯(lián)、時序等等復(fù)雜算法,這個可不是一般人能做到的,反正我還沒這個水平,估計(jì)5年內(nèi)很難達(dá)到,即使有也是google的人了;
    其次,要求中寫著做過數(shù)據(jù)倉庫的項(xiàng)目,DW的項(xiàng)目國內(nèi)一般都在電信、移動、銀行,做這個的人和做互聯(lián)網(wǎng)的人思維方式工作手法完全不同,可以說傳統(tǒng)行業(yè)是比較規(guī)范的,規(guī)范到每個指標(biāo),數(shù)據(jù)統(tǒng)計(jì)口徑都要有文檔支持,雖然也有很多臨時需求,但是比起規(guī)范性來,互聯(lián)網(wǎng)差遠(yuǎn)了,反過來講互聯(lián)網(wǎng)的優(yōu)勢在于靈活,基于 DM能出現(xiàn)更多的新的小應(yīng)用,傳統(tǒng)行業(yè)里面比如電信,DM主要做三個方面的東西,集團(tuán)規(guī)范里面有明確的要求:關(guān)聯(lián),增量模型,流失模型,對應(yīng)起來就是關(guān)聯(lián)分析一般是做產(chǎn)品交叉銷售,增量模型和流失模型都是預(yù)測型模型,Dtree、回歸來做新增預(yù)測,客戶流失什么的,個別省份也會做客戶細(xì)分 (clustering做的),一般這些東西都有一套方法論,一套工作流程,一套完整的開發(fā)文檔,規(guī)范一直到最后的提交物,另外有著DW系統(tǒng)的強(qiáng)大支持,軟件工具的支持,比如IBM DB2,Oracle DW,NCR Teradata。各家也有工具提供業(yè)務(wù)人員和技術(shù)人員使用,IBM Miner,Oracle達(dá)爾文,NCR TWM,還有SAS,spss的DM軟件是相當(dāng)強(qiáng)悍的,畢竟人家的軟件開發(fā)了那么多年,賣的貴也是有道理的。以上都說明了,這些傳統(tǒng)行業(yè)的DM應(yīng)用還是比互聯(lián)網(wǎng)成熟的多的。說道互聯(lián)網(wǎng)就挺新穎得了,隨著搜索的發(fā)展,這些年只要想做Mining的都是想在基于搜索來做,MSRA有一個結(jié)果聚類的小應(yīng)用,就是這樣一個方向,另外互聯(lián)網(wǎng)研究的clickstream也是較為成功的方向,盡管好的應(yīng)用模式還沒有出現(xiàn)。

    另外說金融保險領(lǐng)域也是和互聯(lián)網(wǎng)領(lǐng)域的Mining區(qū)別超級大的,金融的巴塞爾是比較火的,風(fēng)險管理等等。信用卡欺詐預(yù)測……,保險縮減理賠流程時間……,這年頭都在講流程銀行,我不明白是啥東西,也沒學(xué)過,反正牛人都在說,要學(xué)的東西太多了。

    深層次思考一下就會明白,這樣的招聘是根本招不到人的,我承認(rèn)有牛人存在,什么都強(qiáng),但是這樣畢竟少數(shù),可以說是極品中的極品,懂?dāng)?shù)學(xué),懂Mining,懂統(tǒng)計(jì),能Coding,懂?dāng)?shù)據(jù)倉庫,所以互聯(lián)網(wǎng)的Mining,尤其在web2.0成熟之后招人最好還是基于開發(fā)招比較合理,因?yàn)檫@樣慢慢的過渡才能出現(xiàn)一些比較成型,成體系的小型的Mining應(yīng)用,才能收到實(shí)際效果。一般都是做搜索的人開始做這些東西,畢竟做搜索的人基礎(chǔ)還是不錯的。

    另外業(yè)界和學(xué)校是不同的,經(jīng)常聽身邊好多Ph.D講他們那時候?qū)懳恼碌氖虑?,有些還是比較有用的,但是畢竟產(chǎn)業(yè)界和學(xué)術(shù)界有著本質(zhì)的區(qū)別,產(chǎn)業(yè)界要賺錢,學(xué)術(shù)界就是寫文章,呵呵,都知道文章是怎么回事。

    最后,互聯(lián)網(wǎng)領(lǐng)域,無論是IM,web Service,Blog等等都需要一些方向建立一些成功的小應(yīng)用,我喜歡的幾個地方有clickstream,cloud,tag system。讓我們一起期待著在web上也有類似CRM這種應(yīng)用時代的到來,預(yù)祝Web Mining越做越好!

    雜文一篇,牛人不要罵,呵呵
    posted @ 2008-04-08 11:30 在法律保護(hù)下合法地?fù)屻y行 閱讀(189) | 評論 (2)編輯 收藏
    僅列出標(biāo)題
    共5頁: 上一頁 1 2 3 4 5 下一頁 

    公告

    轉(zhuǎn)載、引用、收藏,請標(biāo)明來自:

    http://www.tkk7.com/gupaladino

    導(dǎo)航

    <2025年5月>
    27282930123
    45678910
    11121314151617
    18192021222324
    25262728293031
    1234567

    統(tǒng)計(jì)

    常用鏈接

    留言簿(1)

    隨筆分類(3)

    隨筆檔案(5)

    文章分類(1)

    文章檔案(1)

    相冊

    搜索

    積分與排名

    最新評論

    閱讀排行榜

    評論排行榜

    主站蜘蛛池模板: 一级a性色生活片久久无少妇一级婬片免费放| 色拍自拍亚洲综合图区| 456亚洲人成在线播放网站| 一级毛片**不卡免费播| 亚洲国产成人高清在线观看| 九九99热免费最新版| 亚洲精品国产高清嫩草影院| 亚洲一区二区三区免费| 亚洲一区二区三区无码影院| 国产精品青草视频免费播放| 亚洲日韩aⅴ在线视频| A毛片毛片看免费| 亚洲第一福利视频| 中国人xxxxx69免费视频| 亚洲av无码专区在线| 永久在线毛片免费观看| 青青免费在线视频| 亚洲午夜无码久久久久| 一级毛片免费观看不卡视频| 久久亚洲AV无码精品色午夜 | 久久青草亚洲AV无码麻豆| 无码人妻一区二区三区免费看| 亚洲精品国产成人| 毛片A级毛片免费播放| 美女的胸又黄又www网站免费| 亚洲中文字幕无码专区| 97人妻精品全国免费视频 | 毛色毛片免费观看| 特级毛片免费观看视频| 亚洲AV无码久久| 免费大片黄在线观看yw| 精品特级一级毛片免费观看| 亚洲精品卡2卡3卡4卡5卡区| 麻花传媒剧在线mv免费观看| 亚洲精品人成网线在线播放va | a级成人毛片免费视频高清| 亚洲宅男永久在线| 暖暖日本免费在线视频 | 国产精成人品日日拍夜夜免费| 亚洲神级电影国语版| 在线观看成人免费|