Skip to content
This repository has been archived by the owner on Jun 13, 2018. It is now read-only.

achun/JinBang

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JinBang

河南高考数据汇总, 数据来源 河南省招生办公室网站

综合信息参见 2017 年招生信息概况

每年的数据都是固定的, 请勿使用本工具反复抓取数据

data 目录下的 .json 数据文件位置及重要结构解释

base        provinces {省市代号: 省市名称}
			PC {批次代号: 批次名称}
			KL {科类代号: 科类名称}
			schools {省市代号: [院校代号]}

shengkong   本年省控分数线

fen         本年分数段统计, {科别代号: [[分数, 累计考生]...]}
            累计考生为加入政策性照顾分后对应总分及以上考生累计人数

schools     院校基本信息, 可用于生成信息表格

plans       {院校代号: {批次代号: {科别代号: {专业代号: {total: 计划录取}}}}}
            所有 total 属性表示该分支之下计划招生合计数
            科别之下的 history 表示上年平行投档线
            叶子对象的 href 属性保存原始页面地址

total       本年分批次, 科类招生计划人数统计
            {total: 计划总数, 批次代号: {total: 批次总数, 科别代号: 科别总数}}
            zero 属性汇总招生计划为零的院校, 通常这些是全国招生.

history     上年平行投档线汇总
            planless   本年本科无招生计划的院校 {院校代号: 院校名称}
            renamed    本年名称变化的院校 {院校代号: {old: 原用名, now: 现用名}
            批次代号   {科别代号:[[最低投档分数, 院校代号, 计划招生, 比例因子]]}
                       比例因子的算法
                       先统计某院校计划招生总是 S, 限本科批次, 分批次, 分科类
                       然后每条记录所占的比例数就是: 计划招生/S


rank        综合历史投档线, 预测第一二批次院校投档线
            {
                批次代号: {
                    科别代号: [
                        [预测投档线, 上年最低投档线, 竞争考生, 优势考生, 院校代号...]
                    ]
                }
            }

            算法

                以 history.json 作为预测基础
                以本年计划数和过省控线考生数量, 计算不同批次科类招生系数
                以分数排序, 该分数下的累计考生总数*招生系数作为投档考生数量
                以院校历史投档线排名为顺序
                以本年院校计划消耗投档考生数量, 招不满投档线下降
                满招后剩余考生计入下轮消耗优势考生

备注:

官方地址中按省市查询的院校总数与全部院校总数不符

TODO

  1. gh-pages 分支
  2. 一个长图表囊括所有重要信息, 左文右理, 中间是分数段

License

Apache License 2.0 Copyright 2017 @YU HengChun

Releases

No releases published

Packages

No packages published