职业PDF标准 Python 下载器-CSDN
创始人
2025-01-11 06:35:48
0

目的

下载技能人才评价网 - 职业技能标准查询系统 - PDF 打包下载

使用文件

a.json

代码解析

import base64 import requests import json import os import time  # 读取JSON文件 with open('a.json', 'r', encoding='utf-8') as f:     data = json.load(f) # 从名为 'a.json' 的文件中读取 JSON 数据,并将其存储在 'data' 变量中  # 创建存储文件的文件夹 output_folder = 'pdf_files' if not os.path.exists(output_folder):     os.makedirs(output_folder) # 如果不存在名为 'pdf_files' 的文件夹,则创建该文件夹  # 遍历JSON文件中的每一行 for row in data['rows']:     code = row['code']     file_name = row['fileName']     attachment_path = row['attachment']     # 从当前 'row' 中提取 'code'、'fileName' 和 'attachment' 的值      # 发送请求获取PDF文件内容     headers = {         "Content-Type": "application/x-www-form-urlencoded",     }     resp = requests.post(         "http://biaozhun.osta.org.cn/api/v1/profession/detail",         headers=headers,         data=f"code={code}",     )     # 使用 POST 方法向指定的 URL 发送请求,携带 'code' 作为数据参数,以获取对应的 PDF 文件内容     pdf_data = json.loads(resp.content)     # 将响应内容解析为 JSON 格式并存储在 'pdf_data' 变量中      # 检查是否存在 'data' 键     if 'data' in pdf_data:         pdf_content = pdf_data['data']         # 如果 'pdf_data' 包含 'data' 键,则提取其对应的值作为 PDF 文件内容          # 处理文件名中的特殊字符         safe_file_name = file_name.encode('utf-8').decode('utf-8')         file_path = os.path.join(output_folder, safe_file_name)         # 处理文件名以确保其安全,并构建文件的完整路径          # 将PDF文件内容保存到指定文件夹中         with open(file_path, "wb") as f:             f.write(base64.b64decode(pdf_content))         # 将 PDF 文件内容解码后写入文件          print(f"Saved {file_name} to {file_path}")     else:         print(f"Error: 'data' key not found in response for code {code}. Response: {pdf_data}")     # 如果 'data' 键不存在,则打印错误信息      # 每个请求间隔5秒     time.sleep(5)     # 在每个请求之间暂停 5 秒 
  1. 读取JSON文件
with open('a.json', 'r', encoding='utf-8') as f:     data = json.load(f) 
  • 作用: 从 a.json 文件中读取 JSON 数据并存储在 data 变量中。
  • API: json.load() 将文件对象读取为 JSON 格式。
  1. 创建存储文件的文件夹
output_folder = 'pdf_files' if not os.path.exists(output_folder):     os.makedirs(output_folder) 
  • 作用: 检查是否存在名为 ‘pdf_files’ 文件夹,如果不存在则创建。
  • API:
    • os.path.exists() 检查文件路径是否存在。
    • os.makedirs() 创建目录。
  1. 遍历JSON文件中的每一行
for row in data['rows']:     code = row['code']     file_name = row['fileName']     attachment_path = row['attachment'] 
  • 作用: 遍历 JSON 数据中的每一行,并提取 codefileNameattachment_path
  1. 发送请求获取PDF文件内容
headers = {     "Content-Type": "application/x-www-form-urlencoded", } resp = requests.post(     "http://biaozhun.osta.org.cn/api/v1/profession/detail",     headers=headers,     data=f"code={code}", ) pdf_data = json.loads(resp.content) 
  • 作用: 发送 POST 请求到指定 URL 以获取 PDF 文件内容。
  • API:
    • requests.post() 发送 HTTP POST 请求。
    • json.loads() 将响应内容解析为 JSON。
  1. 检查是否存在 ‘data’ 键
if 'data' in pdf_data:     pdf_content = pdf_data['data'] 
  • 作用: 检查响应 JSON 中是否存在 ‘data’ 键,如果存在则提取其内容。
  1. 处理文件名中的特殊字符和构建文件路径
safe_file_name = file_name.encode('utf-8').decode('utf-8') file_path = os.path.join(output_folder, safe_file_name) 
  • 作用: 处理文件名以确保其安全,并构建完整文件路径。
  • API:
    • str.encode() 编码字符串。
    • str.decode() 解码字符串。
    • os.path.join() 拼接路径。
  1. 将PDF文件内容保存到指定文件夹中
with open(file_path, "wb") as f:     f.write(base64.b64decode(pdf_content)) 
  • 作用: 将解码后的 PDF 内容写入文件。
  • API:
    • base64.b64decode() 进行 Base64 解码。
    • open() 打开文件。
    • file.write() 写入文件。
  1. 打印成功或错误信息
print(f"Saved {file_name} to {file_path}") else:     print(f"Error: 'data' key not found in response for code {code}. Response: {pdf_data}") 
  1. 每个请求间隔5秒
time.sleep(5) 
  • 作用: 在每个请求之间暂停 5 秒。
  • API: time.sleep() 暂停执行。

文件存储

在这里插入图片描述

相关内容

热门资讯

七分钟了解!闲娱棋牌有挂吗,w... 七分钟了解!闲娱棋牌有挂吗,wepower德州都是真的有挂,必备教程(有挂脚本);进入游戏-大厅左侧...
2分钟科普!雀神微信小程序怎么... 2分钟科普!雀神微信小程序怎么开挂,aaPOKER确实是真的有挂,玩家教你(有挂教学)1、点击下载安...
九分钟辅助!决战卡五星游戏辅助... 九分钟辅助!决战卡五星游戏辅助器,德州俱乐部果然有挂,详细教程(有挂揭秘)暗藏猫腻,小编详细说明决战...
8分钟辅助挂!财神十三张特殊牌... 8分钟辅助挂!财神十三张特殊牌外 挂,we-poker原来有挂,新2025版(有挂教学)1、每一步都...
7分钟辅助挂!台州宝宝游戏外 ... 7分钟辅助挂!台州宝宝游戏外 挂,鱼扑克app俱乐部切实是有挂,安装教程(有挂辅助挂)1、任何台州宝...
一分钟实锤!闲逸碰胡黑科技,哈... 一分钟实锤!闲逸碰胡黑科技,哈糖大菠萝十三张一直真的是有挂,微扑克教程(有挂软件)运闲逸碰胡黑科技辅...
六分钟辅助!微信小程序广丰51... 六分钟辅助!微信小程序广丰510k有挂吗,菠萝德州app切实是有挂,AA德州教程(有挂详情)1、起透...
五分钟普及!中至万年麻将有挂吗... 五分钟普及!中至万年麻将有挂吗,德州俱乐部一直是有挂,可靠技巧(有挂普及);该软件可以轻松地帮助玩家...
8分钟发现!葫芦娃捉鸡是真的吗... 8分钟发现!葫芦娃捉鸡是真的吗,红龙poker切实是有挂,科技教程(有挂神器)该软件可以轻松地帮助玩...
4分钟了解!大唐麻将有什么规律... 4分钟了解!大唐麻将有什么规律吗,德扑其实是真的有挂,教你攻略(有挂方法);1、实时大唐麻将有什么规...