介紹 arrow_drop_down
早鳥分享活動開跑中!越早越優惠!

〔參加貼文活動到這裡:https://goo.gl/LptVkX 〕

〔早鳥折價活動時間內,完成指定步驟即可領取折價券〕

12/07~12/11 完成購買|折1000元,可享 $1900 課程價 (限量50人,已使用完畢。)

12/12~12/17 完成購買|折700 元,可享 $2200 課程價 (限量50人,熱烈進行中!!)

12/18~12/24 完成購買|折500 元,可享 $2400 課程價 (限量50人,熱烈進行中!!)

12/25~01/06 完成購買|折300 元,可享 $2600 課程價

註:折價券金額會隨著期限變動,錯過購買時機恕不另外補償囉!


面對網路上每天排山倒海的訊息來源,根本不知道如何「自動、且系統化」的把這些資料蒐集下來,轉化成有價值的資訊,此時,你需要的就是爬蟲的技術!

網路爬蟲,就是幫你自動把目標網站中的特定欄位蒐集下來,再整理成易於分析的格式,讓你有機會透過大量資料的蒐集,看到別人只關注單一零散訊息看不到的黃金!

網路爬蟲最常被使用的情境就是訊息不斷更新,而且稍縱即逝的電商產業、社群網站、還有金融網站,若能透過爬蟲時時監控價格、關注社群變化,便能掌握別人不知道的訊息,享有資訊不對稱的商機!

木刻思,2014 年創立至今,深耕於資料科學的各相關領域,不論是對外開設各種資料分析實體課程,或是與國內外企業合作導入資料科學解決方案,是一群專注於運用數據,探索並解決問題本質的公司。我們專注於各種量化分析的技巧,並時常挑戰各種深不可測的問題。

不論在學習任何的事物時,「觀察直覺」 以及 「實作技術」 都是最重要的部份。只有深刻的直覺,才可以駕馭藝術般的實作技術;同樣的,也只有在透徹了解 「各種實作技術的缺點與限制」 時,才能在許多的碰撞與挫折的經驗中,淬煉出深刻的直覺與觀察力。

課程的設計重點不是在教程式語言,而是幫你歸類出實際撰寫爬蟲時,可能遇到的資料格式以及阻擋手法。讓你知道,碰到甚麼網站,用甚麼方式把資料爬下來,而且用你喜歡的語言!

尤其,後續的分析方法也會影響到語言的選擇,或許你已經知道如何用 Python 做文字分析,那你上完課就可以用 Python 爬新聞網站;或許你喜歡先用 R 做資料觀察,那就用 R 把資料抓下來處理。爬蟲基礎的所有技巧我們都會教,同時給您兩種語言選擇,一定跟市面上不一樣


1. 工作上需要蒐集資料者

2. 有志成為資料分析師者

3. 行銷經營、趨勢潮流追隨者

4. 資訊提供商

5. 對市場資訊敏感者

6. 小散戶、認真的賭徒們

1. 學會 R & Python 環境設定、資料分析基礎,以及爬蟲套件的使用
2. 能夠藉由觀察網站連線技巧判斷不同網站的阻擋方式並予以破解
3. 可以把抓下來的資料運用不同方式整理成易於分析的格式
4. 了解如何使用第三方 API 工具抓取想要的資料

分享此篇活動貼文領折價券,還可以解鎖小技巧喔:http://bit.ly/2BDSylp

▶︎ 分享達 100 人,搶先釋出解鎖影片:探索AJAX網站小技巧

▶︎ 分享前 200 人,完成貼文活動要求,皆可領取課程折價卷 300 元

課程常見問題

Q1. 上課前,需要具備哪些能力嗎? 

不需要,只要你想快速蒐集網路上的海量資料,或是對資料分析有興趣,甚至只是想透過爬蟲學習程式語言,都很歡迎來上這堂課!

Q2. 上課前,我需要先準備什麼嗎?

可以先行安裝 R 或(和) Python,但如果不會或是不確定怎麼安裝,開課後,也可以跟著課程第一單元的教學一步步進行程式的安裝與設定喔!

Q3. 募資預購是什麼意思? 

以本堂課程為例,即日起至 1/22 為止,將會是預購優惠價 $2,900 元。

正式課程預計在 2018 / 02 / 12 (一) 上線!課程上線後,您就可以無限次數、地點、時間,在 YOTTA 平台上觀看本堂課程!

Q4. 募資預購時間到什麼時候? 

這堂課在 12/6 (四) ~ 1/22 (一) 開放課程募資預購,預購期間購課優惠 $2,900 元。 (1/23 起將恢復原價 $4,600 元)

Q5. 這門課什麼時候開始上課?

若募資成功後,我們預計第一批課程將於 2017/2/12 (一) 開始上課喔!  

Q6. 這門課可以看多久? 

購課後享不限次數、永久觀看,可以一直看一直學!  

Q7. 可以問老師問題嗎?

當然!歡迎到「購課問答」詢問 ; 當學習遇到問題時,也歡迎到「課程討論區」與老師同學一同互動。


購買相關問題

Q8. 我要如何購買課程呢?

非常的簡單!在你的右手邊有「立即購買」的字樣,點進去就可以囉!

Q9. 目前有哪些付款方式呢?

目前 YOTTA 提供三種付款方式: 

 a/ 信用卡付款 

 b/ 超商付款(7-11、全家、萊爾富、OK 即可繳費) 

 c/ ATM 轉帳

Q10. 為什麼我已經付款了,訂單狀態仍顯示未付款?

若您選擇「超商」或「ATM」方式付款,金流處理時間需要 1~3 個工作天, 等金流完成入帳後,您的「訂單狀態」將會轉為顯示「已付款」,需稍待幾天喔!

Q11. 請問什麼時候會收到發票?

當本堂課程募資結束後 10 天,電子發票將會透過 E-mail 方式寄送電子發票給您。

Q12. 看不到募資影片嗎?


單元

18

預計總長

480mins

預計測驗

尚無測驗

  • 零、程式基礎
  • 1 R環境設定&資料處理基礎篇  
  • 2 Python環境設定&資料處理基礎篇  
  • 一 、學會模仿你的瀏覽器
  • 3 瀏覽器如何拿到資料以及呈現網頁?  
  • 4 練習使用 Network Inspector觀察連線狀態  
  • 5 如何模仿 http GET?  
  • 6 用 R 和 Python 模仿瀏覽器寫出一隻爬蟲  
  • 二、資料藏在哪裡?
  • 7 資料躲貓貓,阻擋技巧破解術  
  • 8 R & Python阻擋技巧網站演練  
  • 9 如何發出 http POST  
  • 10 利用http POST在留言板留言  
  • 三、資料整理方法
  • 11 各種資料的處理方法(CSV HTML XML JSON)說明  
  • 12 XPATH Selector  
  • 13 CSS PATH Selector  
  • 14 JSON Parser  
  • 四、解鎖更多爬蟲技巧
  • 15 爬蟲深入技巧1:FB Graph API——找出最喜歡按讚你的人  
  • 16 爬蟲深入技巧2:如何 Download File + Excel & CSV & ZIP Parser  
  • 17 爬蟲特殊技巧!!:Regular Expression Selector  
  • 18 爬蟲暗黑祕技!!:Selenium  

有疑問嗎?讓老師幫你解惑!

開始分享你的學習成果吧!

這裡是專屬於課堂學員及老師可以互動的作業區,學員們可以透過實際操作來複習課程中所學習到的內容,作業完成後只要簡單上傳到平台裡,就能得到更多老師的指點唷!同時,在這裡也可以觀摩其他學員的成果,一起來互相切磋吧!

作業觀摩

目前還沒有任何學員上傳作業喔!來當第一個吧~

回頂端