猿问

从 Python 中的抓取数据中删除 '\n'

我从 Github 上抓取 repo 的名称,例如:


repositorys = []

for ulr in user_repo_url: # in this list I have url like ('https://github.com/USER/?tab=repositories)

    source = urllib.request.urlopen(url).read()

    soup = bs.BeautifulSoup(source,'lxml')

    repos = [repo.text for repo in soup.find_all('div',class_='d-inline-block mb-1')]

    repositorys.append(repos)


return render(request,'file.html',{'repositorys':repositorys})

我使用 Django 并且一切正常,但是为了获得明文,我得到了名称和 '\n' 符号。我正在尝试使用 strip 和 map 功能,但它们没有用。你有任何其他建议为什么它不起作用?


白衣非少年
浏览 144回答 1
1回答

吃鸡游戏

如果您的目标是简单地删除所有出现的\n您可以改为使用repo.text.replace('\\n', ''). 请注意,\如果要删除换行符,则必须转义 if 字面意思是字符串中的字符,否则将其保留为 repo.text.replace('\n', '') 。
随时随地看视频慕课网APP

相关分类

Python
我要回答