Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SEO - 加入 robots.txt, sitemap, prerender 讓搜尋引擎可以獲取網頁資訊 #589

Merged
merged 8 commits into from
Mar 2, 2019

Conversation

SoftwareSing
Copy link
Member

  • 加入新的package,更新時需要執行 meteor npm install
  • 有更動config檔
  • 需要安裝 Google Chrome

加入 robots.txt ,讓bot可以讀取,以得知哪些網址我們不建議掃描,還有建議掃描的sitemap在哪

加入 sitemap ,提供公司網址
網址會依照公司評級指定優先度,評級高的公司會有較高的優先度推薦搜尋引擎抓取 (抓取順序不影響搜尋結果排序)

使用 prerender 來讓搜尋引擎的BOT可以抓到完整的頁面
當收到BOT的訪問請求時,會轉由 prerender server 代為訪問網站,並將完整的結果傳回去
prerender server 監聽的port可以在config中修改,目前port設定為 3900


由於會開 prerender server ,需要在伺服器安裝 Google Chrome

可以用這條指令直接安裝

wget -qO- https://github.com/raw/SoftwareSing/linux-install/master/install-chrome.sh | bash

安裝後建議重新啟動

加入 robots.txt 與 sitemap 以幫助搜尋引擎爬網站

由於內容的網址必須動態產生,因此 robots.txt 不能使用單純的靜態檔案提供

sitemap針對公司網址會依照公司評級指定優先度,評級高的公司會有較高的優先度推薦搜尋引擎抓取 (抓取順序不影響搜尋結果排序)
使用 prerender 來讓搜尋引擎的BOT可以抓到完整的頁面

當收到BOT的訪問請求時,會轉由 prerender server 代為訪問網站,並將完整的結果傳回去

prerender server 會監聽的port可以在config中修改
設定3秒的等待時間,讓網頁能跑完整,也避免過於快速的做下一次請求造成伺服器負擔
增加更多不希望搜尋引擎去爬的頁面
在 production 設定為 true 的情況下才會開啟 prerender server
@SoftwareSing SoftwareSing reopened this Feb 28, 2019
@SoftwareSing
Copy link
Member Author

NOTE: 在這次的config檔變更中,production 在伺服器中必須設定為 true,而非 config.json 中的 false

@mrbigmouth mrbigmouth merged commit 6ee31d8 into ACGN-stock:dev Mar 2, 2019
This pull request was closed.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants