时间:2021-05-22
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
以下文章来源于数据STUDIO,作者龙哥带你飞
Python分析抖音用户行为数据视频讲解地址
https:///v_1meaw5kgh3s.html" class_name = "select-item" class_name_father = "bar-li" links = get_javascript0_links(url, class_name, class_name_father) head_data = pd.DataFrame(columns=['tv_name','uid','contentsId','contents','likeCount']) for num, link in enumerate(links): tv_name = f"第{num+1}集" tv_id = get_tvid(url=link) data = get_data(tv_name,tv_id) head_data = pd.concat([head_data,data],ignore_index = True) time.sleep(sleep_second) return head_data
获取到的数据结果如下:
>>> data = main()>>> data.info()"""<class 'pandas.core.frame.DataFrame'>RangeIndex: 246716 entries, 0 to 246715Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 tv_name 246716 non-null object 1 uid 246716 non-null object 2 contentsId 246716 non-null object 3 contents 246716 non-null object 4 likeCount 246716 non-null objectdtypes: object(5)memory usage: 9.4+ MB""">>> data.sample(10)运用中文分词库jieba分词,并去除撤销词。
def get_cut_words(content_series): """ :param content_series: 需要分词的内容 :return: list, 点击class为class_name进去的超链接 """ # 读入停用词表 import jieba stop_words = [] with open("stop_words.txt", 'r', encoding='utf-8') as f: lines = f.readlines() for line in lines: stop_words.append(line.strip()) # 添加关键词 my_words = ['倪妮', '刘诗诗', '锁锁', '蒋三岁', '陈道明'] for i in my_words: jieba.add_word(i) # 自定义停用词 my_stop_words = ['哈哈哈','哈哈哈哈', '真的'] stop_words.extend(my_stop_words) # 分词 word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False) word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2] # 条件筛选 return word_num_selected运用升级版词云图库stylecloud可视化弹幕结果。
import stylecloudfrom IPython.display import Image text1 = get_cut_words(content_series=data.contents)stylecloud.gen_stylecloud(text=' '.join(text1), collocations=False, font_path=r'C:\Windows\Fonts\msyh.ttc', icon_name='fas fa-rocket',size=400, output_name='流金岁月-词云.png')Image(filename='流金岁月-词云.png')到此这篇关于使用Python获取爱奇艺电视剧弹幕数据的示例代码的文章就介绍到这了,更多相关Python获取爱奇艺电视剧弹幕数据内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
爱奇艺不能看预约的电视剧,可以提前预约,预约的电视剧需要等到电视剧上映才能看。查看预约电视剧的方法如下: 1、打开爱奇艺APP。 2、在点击VIP会员,找到
ipad爱奇艺下载电视剧的方法是: 1、ipad上要先安装爱奇艺。 2、打开爱奇艺看,可以直接选择电视剧中热门里面找,或者点击右上方的搜索电视剧。 3、在
爱奇艺下载电视剧的步骤是: 1、在手机上打开爱奇艺,选择并点开自己想要下载的电视剧。 2、点击右下角的下载即可。 爱奇艺,原名奇艺,于2010年4月22日
以爱奇艺为例,缓存电视剧的方法是: 1、打开爱奇艺,选择并点开自己想要选择的电视剧。 2、点击右下角的下载即可。 爱奇艺,原名奇艺,于2010年4月22日
爱奇艺下载电视剧的方法是: 1、打开爱奇艺,选择并点开自己想要选择的电视剧。 2、点击右下角的下载即可。 爱奇艺,原名奇艺,于2010年4月22日正式上线