一、项目简介
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API
2025年10月14日
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API
2025年10月14日
对于经常进行网络编程的程序员来说,session与cookie是经常会碰到的,今天我们就来介绍一下。
我们都知道web服务器与客户端通信使用的是HTTP协议。HTTP协议是一个无状态的协议,每一次的http请求都是独立的,也是不持久的,通过HTTP协议无法判断两个请求是否来自于同一个用户。但是几乎所有带会员功能的网站都需要判断用户的身份,这个时候就要使用会话控制了。基本的原理就是在网站中跟踪一个变量,通过该变量来判断用户的身份,以及存取该用户的数据。
2025年10月14日
Cookie是保存在浏览器端的一些数据,是http协议的一部分,一般用于保存用户的登录信息,当浏览器发送http请求时,会将Cookie封装在http协议的头信息中,和其他数据一块儿发送至服务器端,服务器端拿到Cookie数据后,就可以对用户身份进行校验。
2025年10月14日
Cookie历史悠久——自互联网诞生之初就已存在。
但即便到了今天,仍有许多开发者误用或误解其工作原理。结果如何?
登录异常、CSRF攻击、隐私泄露,或是彻底崩溃的用户体验。
无论你是刚接触网页开发的新手,还是想温习最佳实践的老手,以下是每位开发者必须知道的10个关键Cookie事实——附带可立即应用的现实场景案例。
2025年10月14日
引言
在现代网络应用开发中,高并发场景下的资源利用率与响应速度已成为核心挑战。传统同步HTTP请求处理库(如requests)采用串行I/O等待模式,在面对大量并发请求时,会因线程阻塞导致资源浪费与性能瓶颈。例如,处理100个网络请求时,同步方式可能需要200秒才能完成,而基于异步I/O模型的aiohttp框架可将耗时压缩至5秒,这种数量级的性能提升凸显了异步HTTP编程的技术价值。
2025年10月14日
最近遇到一个项目,需要从平台自动爬取相关数据,但是最近的平台的数据接口加固了,除了加入了用户登录后的验证cookie以外,还加入额外的header参数的验证,而且密码被js加密后(非普通MD5加密)post到服务器,js代码已经混淆,基本上不可读,这使得普通的网络爬虫技巧全部失效。一周后,cookie失效,服务器就会提示请登录,强制客户端重新登录。这给我们自动化爬数据带来新的麻烦,要重新登录,就成为了半自动了。
2025年10月14日
很多同学在做数据采集/自动化测试的时候,都会遇到一个问题:
有些数据需要登录才能访问,每次写爬虫都要重复模拟登录,太麻烦了。
其实,Cookie 就是解决这个问题的关键!
1 什么是 Cookie?
简单来说,Cookie 就是网站放在你浏览器里的一张“小纸条”,上面写着:
你是谁(登录凭证)
你之前做过什么操作(会话记录)
网站需要记住的配置信息(比如语言偏好)
所以,只要带上这张“小纸条”,网站就知道你已经登录过了。
2025年05月11日
当前行业内组织的 “红蓝对抗演习” 在检验企业安全的同时也在磨练技术人员的技术水平,在近几年的演习中可以发现攻防双方的水准都有了极大的提升,本文将以红队的视角去阐述技术思想。与常规的渗透测试相比,红队攻防更多的是渗透思想上的差异,而我个人的理解认为 “隐蔽”、“持久化”是最重要的思想,如何做到快速、高效地拿下目标,隐蔽、持久的进一步操作,也正是核心的差异所在。熟悉我的读者,一定看过之前 “红队攻防基础建设” 相关的文章,本文也会串联之前知识点灵活地运用到实战场景下。