chilfish / weibo-archiver Goto Github PK
View Code? Open in Web Editor NEW将微博导出备份的油猴脚本,为号被完全夹没前未雨绸缪 😭
Home Page: https://weibo.chilfish.top
License: Apache License 2.0
将微博导出备份的油猴脚本,为号被完全夹没前未雨绸缪 😭
Home Page: https://weibo.chilfish.top
License: Apache License 2.0
项目很好用,感谢付出。
我在使用中遇到几个问题,比如https://weibo.com/u/1304194202,我获取日期输入2023-05-31至2023-12-15 只能获取2023-07-07至2023-12-15的66条微博,而2023-06-01至2023-07-07之间还有微博没有获取到。
于是我再次获取2023-05-31至2023-07-07之间的微博,并用合并命令合并,将2023-05-31至2023-07-07的imgs.csv中的内容复制到2023-07-07至2023-12-15的imgs.csv里。再次运行下载图片命令后并不能下载2023-05-31至2023-07-07这期间的图片。
微博界面上,追加获取最近两天的微博,然后也得到了json和csv,在本地浏览界面导入,导入的时候用合并的方式,然后导入那两个文件,提示导入成功,57条。然而在本地浏览界面,还是刷不到最近两天的,在日期选择那里选择了起始和终止日期为具体的最近两日,结果为空。
先对一个微博全部获取。得到xx.json和xx.csv。导入到本地界面。
等两天,对同样的微博,获取日期选择最近两天的具体日期,等待获取完毕,得到xx(1).json和xx(1).csv。
然后在本地浏览界面点击导入,选择xx(1).json。等待提示导入完成。
然后刷新本地界面。
?
Edge
No response
No response
看不懂作者在说什么呜呜,进度条走完,为什么点导出没有反应啊,作者大大
另外导出完之后要怎么做才能实现真正备份啊,你写的后面那些不知道该怎么操作,我恨我自己😭
应该是判断的顺序问题,https://weibo.chilfish.top/p/2?pageSize=20#O2vJhCzZi
会先跳到 /p/0 然后被修正成 /p/1 ,而不是真的直接跳到对应的 url
No response
v0.3.0
No response
No response
No response
由于拿 Python 来服务 SPA 会有很多难解决的 Bug,最终还是决定使用 vite 来预览结果了。
区别在于改用 Node.js 来下载图片和查看微博,如下图。在 Node.js 官网 下载,然后按 网上教程 (类似这个,只要能看到版本号就成功了)
只是单纯备份下来还是觉得差点什么.
希望大佬可以支持此类
感觉应该让这个窗口可以折叠起来,不然有些太碍眼了
No response
No response
No response
No response
No response
{
"comments": [
{
"created_at": "Wed Feb 21 13:27:09 +0800 2024",
"id": "5003845633836905",
"img": "https://weibo.cn/sinaurl?u=https://github.com/orgs/community/discussions/109171",
}
]
}
No response
v0.3.1
No response
No response
No response
奇怪的机制:is_show_bulletin=2 配合上 flow=0 才能获取热评,但是在某个时间之前微博是没法按热评排序的,所以要么找出这个时间点来特判,要么看看微博自己是怎么解决的
Originally posted by @Chilfish in #17 (comment)
发现并发过快了,爬取十分钟、一千多条之后便得不到数据了,有时会返回错误码
No response
No response
v0.3.9
No response
No response
Originally posted by copymonopoly March 24, 2024
检索到10000条,只下载了1500多条卡住不动了,怎么办
版本:v0.3.7
导入带格式或不带格式的json,该有的key具备,多图无法正常显示,其他信息都显示正常。
请问只有用插件生成的图片才能用默认的CDN吗?
用隔壁项目保存的json文件,格式是像这样的,有空格和换行:
导入的那个json, 该有的所有 key 都改好了,uid, name, imgs... 删除不同的key,取消换行并删除空格也没用。
导入后,多图无法显示,单图显示正常。
根据Network判断,可能是css把多条图片链接处理为一个链接了?而单图就没这个问题。
但是我看脚本生成的json的文件也是用逗号隔开的呀...
刚刚又试了生成无格式的json,没有换行也没有空格,就是和插件生成的格式一模一样的,导入后多图还法显示。
请问应该怎么做呢?
v0.4.0
Chrome 125.0.6422.77(正式版本) (arm64)
如下图
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.