目前Google Search Console的Performance报告下的“Page”及“Query”报告支持使用正则表达(RegEx)筛选,点击下图中的New按钮,在下拉菜单中可以选择这两个报告。
下面给大家介绍一些独立站运营人员经常使用到的筛选条件以及对应的正则表达式如何撰写,大家可以根据需要复制后稍作修改就能完成自身网站的数据筛选分析。
1. 筛选包含某个词的关键词或者页面
筛选包含某个词的关键词或者页面,在这个词前后用.*。例如,需要搜索包含pro的词,正则的写法是.*pro.*。
2. 筛选多个特定的页面
如果需要筛选多个页面,URL相同的部分可以只写一次,后面的文件路径使用 | 进行连接,例如:
^https://crossborderdigital.cn/(google-seo|orm-service/sem-service)/ $
表达式符号说明:
- ^ 表示开始
- ()表示将一系列元素组合在一起
- | 表示或的意思,满足其中一个条件即可
- $ 表示结束
3. 否定筛选
Google Search Console的支持正则表达式否定筛选,直接选择Doesn’t match regex即可,下面的正则表达式跟非否定筛选写法一致,如需要筛选不包含pro的词,如下图:
4. 指定关键词字符数进行筛选
如果需要直接查看网站非长尾关键词来源,可以选择字符数少于10的关键词(也可以更长字符数),正则表达式的写法是:^[\w\W\s\S]{1,10}$,那么,符合这一条件的关键词就能快速被筛选出来,超过10个字符数的长尾关键词将被排除。
正则表达式符号说明:
- ^ 表示开始
- [ ] 匹配字符数长度
- \w 表示匹配任何大小写字母,数字以及下划线。等同于[A-Za-z0-9_]\g
- \s 表示空格
- \W 表示匹配非字母,数字及下划线
- \S 表示匹配任何非空格
- {1,10} 表示前面的规则重复1-10次
- $ 表示结束
5. 筛选长尾关键词
筛选长尾关键词,可以选择按照字符数长度筛选,例如要搜索字符数大于40的长尾词,对应的正则表达是:^[\w\W\s\S]{40,}$
正则表达式符号说明:
- ^ 表示开始
- [\w\W\s\S] 表示匹配任何字符,拆分的符号对应意义见上文第四点。
- {40,} 表示重复40次及以上
- $ 表示结束
- (\w+\s) 表示任何字数后面紧跟一个空格
- {4,} 表示重复4次以上
- \w+表示以单词结尾
6. 查找长URL
如果要查找URL较长的页面,例如,超过100个字符数的URL,可以使用正则表达式:^[\w\W\s\S]{100,}$
7. 查找包含特殊字符的URL
查找URL包含特殊字符,正则表达式撰写:[^\/\.\-:0-9A-Za-z_]
正则表达式符号说明:
- [^] 表示排除一系列字符
- \/\.\-\: 表示排除URL里面非字母类的字符,例如 ://, –
- 0-9A-Za-z_ 需要排除的字母,数字
8. 分析关键词了解用户意图
我们在做关键词分析的时候,经常会把关键词分为四大类,包括Informational,Navigational, Commercial, Transactional. 对应的正则筛选模板可参考下方:
- Information: who|what|when|how|why
- Navigational: .*brand.*
- Commercial: .*(best|top|vs|review*).*