一、项目简介
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API
2025年10月14日
此项目基于 PyWebIO、FastAPI 和 HTTPX,是一个高效的异步数据爬取工具,专注于抖音/TikTok平台的数据提取。通过Web端界面,用户可以在线批量解析并下载无水印的视频或图集。此外,本项目还提供了数据爬取API
2025年10月14日
对于经常进行网络编程的程序员来说,session与cookie是经常会碰到的,今天我们就来介绍一下。
我们都知道web服务器与客户端通信使用的是HTTP协议。HTTP协议是一个无状态的协议,每一次的http请求都是独立的,也是不持久的,通过HTTP协议无法判断两个请求是否来自于同一个用户。但是几乎所有带会员功能的网站都需要判断用户的身份,这个时候就要使用会话控制了。基本的原理就是在网站中跟踪一个变量,通过该变量来判断用户的身份,以及存取该用户的数据。
2025年10月14日
Cookie是保存在浏览器端的一些数据,是http协议的一部分,一般用于保存用户的登录信息,当浏览器发送http请求时,会将Cookie封装在http协议的头信息中,和其他数据一块儿发送至服务器端,服务器端拿到Cookie数据后,就可以对用户身份进行校验。
2025年10月14日
Cookie历史悠久——自互联网诞生之初就已存在。
但即便到了今天,仍有许多开发者误用或误解其工作原理。结果如何?
登录异常、CSRF攻击、隐私泄露,或是彻底崩溃的用户体验。
无论你是刚接触网页开发的新手,还是想温习最佳实践的老手,以下是每位开发者必须知道的10个关键Cookie事实——附带可立即应用的现实场景案例。
2025年10月14日
引言
在现代网络应用开发中,高并发场景下的资源利用率与响应速度已成为核心挑战。传统同步HTTP请求处理库(如requests)采用串行I/O等待模式,在面对大量并发请求时,会因线程阻塞导致资源浪费与性能瓶颈。例如,处理100个网络请求时,同步方式可能需要200秒才能完成,而基于异步I/O模型的aiohttp框架可将耗时压缩至5秒,这种数量级的性能提升凸显了异步HTTP编程的技术价值。
2025年10月14日
最近遇到一个项目,需要从平台自动爬取相关数据,但是最近的平台的数据接口加固了,除了加入了用户登录后的验证cookie以外,还加入额外的header参数的验证,而且密码被js加密后(非普通MD5加密)post到服务器,js代码已经混淆,基本上不可读,这使得普通的网络爬虫技巧全部失效。一周后,cookie失效,服务器就会提示请登录,强制客户端重新登录。这给我们自动化爬数据带来新的麻烦,要重新登录,就成为了半自动了。
2025年10月14日
很多同学在做数据采集/自动化测试的时候,都会遇到一个问题:
有些数据需要登录才能访问,每次写爬虫都要重复模拟登录,太麻烦了。
其实,Cookie 就是解决这个问题的关键!
1 什么是 Cookie?
简单来说,Cookie 就是网站放在你浏览器里的一张“小纸条”,上面写着:
你是谁(登录凭证)
你之前做过什么操作(会话记录)
网站需要记住的配置信息(比如语言偏好)
所以,只要带上这张“小纸条”,网站就知道你已经登录过了。
2025年10月14日
TIN(Triangulated Irregular Network)也名“曲面数据结构”,是由Peuker和他的同事于1978年设计的一个系统,它是根据区域的有限个点集将区域划分为相连的三角面网络,三角面的形状和大小取决于不规则分布的测点的密度和位置,能够避免地形平坦时的数据冗余,又能按地形特征点表示数字高程特征。
TIN常用来拟合连续分布现象的覆盖表面。
不规则三角网数据结构设计中需要考虑的因素:
2025年10月14日
奥维是一款非常方便的地图浏览器工具,我最早接触它是在大学野外采样用到。今天我们就来谈谈奥维地图的优点:
(1)支持多款地图源