陳沛君EXCEL->讀取外部資料讀入->從Web
劉任昌079影片 道瓊30成分股 EXCEL讀取外部資料 EXCEL讀取外部資料:陳沛君網頁更新後 網路爬蟲 網路爬蟲 (英語: web crawler ),也叫 網路蜘蛛 ( spider ),是一種用來自動瀏覽 全球資訊網 的 網路機器人 。其目的一般為編纂 網路索引 。 網路 搜尋引擎 等站點通過爬蟲軟體更新自身的 網站內容 或其對其他網站的索引。網路爬蟲可以將自己所存取的頁面儲存下來,以便搜尋引擎事後生成 索引 供使用者搜尋。 爬蟲存取網站的過程會消耗目標系統資源。不少網路系統並不默許爬蟲工作。因此在存取大量頁面時,爬蟲需要考慮到規劃、負載,還需要講「禮貌」。 不願意被爬蟲存取、被爬蟲主人知曉的公開站點可以使用robots.txt檔案之類的方法避免存取。這個檔案可以要求 機器人 只對 網站 的一部分進行索引,或完全不作處理。 網際網路上的頁面極多,即使是最大的爬蟲系統也無法做出完整的索引。因此在公元2000年之前的全球資訊網出現初期,搜尋引擎經常找不到多少相關結果。現在的搜尋引擎在這方面已經進步很多,能夠即刻給出高品質結果。取自 維基百科
留言
張貼留言