最近在做一个 Android 从其他客户端分享 http url 到自己应用,然后以图文消息的方式展示发送给自己的好友。通过 jsoup 把一些网页信息图片先爬出来做预览。然后点击可跳转 webview 预览全文
遇到坑的问题比较多,例如很多网络 jsoup 不一定能扒下来一下信息来预览。另外一个比较棘手的是,由于各个应用通过:
text 传回来的 text 内容千变万化。但是内部肯定包含一个可以访问的 web url。
- UC新闻的 可能是 “某某新闻标题 http://xxxx”
- QQ阅读器的可能是 “http://xxxxx 某某网页摘要”
…… 等等
中间可能是以空格分割 或者 以中文逗号句号分开等等,无法完整准确有效的提取其中的 url
我可能会去这样。但是事实证明这样只能过滤出部分应用。网上搜索也没有比较好的办法。
最后同事的指点下 通过正则 Android 下 有 Patterns.WEB_URL; (Java开发可提取该正则表达式)