检查清单
- sitemap
- robots.txt
- head
- 301
- 404
检查内容
sitemap:用 @astrojs/sitemap 省心,构建自动出。 docs.astro.build
robots:把不想收录的过滤页、站内搜索页、参数页(?q=、?tag=)禁掉。
RSS:资源站如果内容更新频繁,RSS 对“回访”和被订阅很有用(尤其技术圈)。
结构化数据(Structured Data)
资源站非常适合加 JSON-LD: 文章页:BlogPosting
资源详情:可用 SoftwareApplication / Product / WebSite(视你的资源类型)
面包屑:BreadcrumbList 结构化数据比“堆关键词”更可靠。
分页与“薄内容页”控制
分类/标签页最大风险:生成大量只有 1~2 条内容的页面(薄内容),容易拉低整体质量评价。
标签页建议做:有门槛(例如 count >= 3 才生成独立标签页),其余标签只做“页面内展示,不生成可索引页”。
分类页可以全生成,但要分页、加简介、加推荐内容。
图片与性能(资源站通常图片多)
统一图片域名与缓存策略(你之前提到 OSS/CDN 就很适合),并确保图片 URL 稳定。
避免首页一次性渲染几百张缩略图;用分页/分段加载,但要保证 SSR/SSG 输出的 HTML 仍然有可抓取内容(不要把核心列表全交给纯前端渲染)。
分类/标签层级怎么做(适合“资源站”)
一句话原则:分类负责“树(层级)”,标签负责“网(属性)”。
推荐的模型(最稳、最利于 SEO)
1)分类(Category)= 1~2 层,尽量少
资源站常见:
一级:工具 / 素材 / 教程 / 模板 / 代码片段 …
二级:工具/截图、工具/压缩、素材/图标、素材/插画 …
URL 建议:
/categories/
/categories/
2)标签(Tag)= 扁平化,不做层级
标签更像“特征”:免费、开源、Mac、Chrome 扩展、AI、CLI、中文…
URL 建议:/tags/
强建议做“标签合并/同义词”:比如 ai、A.I.、人工智能 最终落到同一个 tag(否则越做越乱)。
3)不要做“多维筛选页可索引”
例如 /resources?category=tools&tag=free&platform=mac 这类“组合页”会指数级爆炸,SEO 上通常应:
允许用户用它筛选(体验层面)
但 不让搜索引擎收录(robots 或 meta noindex),只收录“分类页 / 标签页 / 资源详情页”。
Content Collections 里怎么落地(思路)
resources 集合 schema 里建议字段:
title, description, pubDate/updatedDate
category(单选,指向分类)
tags(多选数组)
cover、website、github、price、platform 等
分类/标签建议用“数据集合/JSON”维护(集中管理 slug、展示名、同义词),然后在内容里引用,减少手写出错(Astro 的内容集合与引用数据的思路本身就是为这种场景服务的)。 docs.astro.build