https://test.ru/test-url/other
http://test.ru/test-url
//test.ru/test-url
https://www.test.ru/test-url/other
http://www.test.ru/test-url
www.test.ru/test-url/other
test.ru/test-url
testru/test-url/other
需要获取 test-url/other
不提供 parse_url,我试过了,它不知道如何处理这些地址的一半并确定这些是链接,尤其是现在使用它
在您的情况下,标准化URI然后在第一次听证会之前切断所有内容就足够了。好吧,或者只是从第一次听证会中删除并切断所有内容,首先删除协议分隔符:
不需要在不需要的地方使用正则表达式。此代码将运行得更快,甚至会处理类似
ftp://test.ru/test-url
or的结果smb://test.ru/test-url
。而且代码非常简单,即使是小学生也能看懂和维护。使用正则表达式,这是一个适合您的示例:
此正则表达式将返回“不带”第一个斜杠
如何使用:
我差点忘了,例如:https ://regex101.com/r/kqm48P/1/
也许只是规范化 parse_url 下的 url?
更容易理解