서울시는 결재문서, 정책연구보고서 등 시가 생산한 약 500만 건 이상의 주요 행정정보 목록을 깃허브에 공개합니다. 이를 통하여 서울시 공공데이터에 대한 접근성과 활용성을 높일 수 있을 것으로 기대합니다. 서울시 행정정보 데이터는 누구나 자유롭게 이용하실 수 있습니다.
원본 데이터 : 서울정보소통광장(opengov.seoul.go.kr)
서비스 소개 : 정보소통광장 안내 바로가기
-
데이터 크롤링시 유의사항
-
데이터 공개 후 일부 사용자가 웹 사이트 수집 프로그램을 과도하게 사용하여 문서를 수집하는 관계로, 서비스에 지장을 주는 경우가 확인되고 있습니다.
-
다수 시민에게 안정적 서비스를 제공하기 위하여 서버에 과도한 부하를 유발하는 사용자는 부득이하게 네트워크단에서 차단이 될 수 있으므로 아래 권고사항을 지켜주시기 바랍니다.
-
권고 사항 : 웹 사이트 수집 프로그램을 사용하여 정보소통광장 문서를 조회하는 경우, 한 페이지 수집 후 다음 페이지를 요청하기까지 10초 이상의 간격을 두시기 바랍니다. (Crawl-delay:20)
-
벌크데이터 요청
-
대량 벌크데이터가 필요하실 경우, 서울시 정보소통광장 담당자에게 연락주시기 바랍니다. (별도 전달)
-
문의(서울시 정보소통광장 담당) : [email protected] , [email protected]
-
결재문서
-
서울시가 생산한 모든 결재문서와 원문 공개 대상을 함께 제공 * 원본 데이터 - 결재문서 원문 : 과장급 이상 결재문서는 원문 공개를 제공 * 원본 데이터 - 정보목록 : 서울시에서 생산한 모든 문서(팀장 결재, 1인 결재 등)의 목록 제공
-
대상 기관 : 서울시 본청(사업소 포함)
-
공개 범위 : 2015년 1월 ~ 2016년 5월 현재(약 500만 건)
-
생성 주기 : 매주 업데이트 , 매주 월요일 등록(전주,월~일까지)
-
초기 데이터 * 2015.1월~2016년 4월, 월별 데이터생성 : 20150301_20150331_info_list.csv * 깃허브의 파일크기 제약으로 인해 데이터파일이 분할되어 작성될 수도 있음 * 2016.5월 이후, 주별 데이터 생성 : 20160509_20150515_info_list.csv
-
정책연구보고서
-
12개 기관(서울시 및 산하 투자출연기관 등)의 정책보고서와 연구보고서 공개 * 원본 데이터 - 정책연구자료
-
대상 기관 : 서울시(학술용역, 기술용역), SH도시연구원, 보건환경연구원, 서울디자인 재단, 서울물연구원, 서울시복지재단, 서울시립대 서울학연구소, 서울시여성가족재단, 서울연구원, 서울특별시의회, 한성백제박물관
-
공개 범위 : 정보소통광장 서비스 대상 전체
-
생성 주기 : 매월 업데이트 , 매월 첫 업무일 등록 (전월, 휴일이 지난 첫 업무일)
-
초기 데이터 * ~2016년 4월 , 일괄 데이터생성( 약17.268건) : 20150101_20160430_research_list(util 2016.04).csv (해당 데이터들의 최초 생산일 확인 필요) * 2016년 5월 이후 월별 생성(최초 신규 생성 일자:2016년6월 1일 생성)
-
사전정보공표
-
시민이 정보공개를 청구하기 전에 미리 공개하는 행정정보 서비스로, 약 327종 513개 업무에 대한 정보를 공개하고 있음 * 원본 데이터 - 사전정보공표 * 공표 항목 : 공표항목 전체 모음
-
제공 범위 : 복지, 건강 등 12개 분야, 513개 공표업무
-
공개 범위 : 정보소통광장 서비스 대상 전체
-
생성 주기 : 매월 업데이트 , 매월 첫 업무일 등록 (전월, 휴일이 지난 첫 업무일)
-
초기 데이터 * ~2016년 4월, 일괄 데이터생성( 약6,355건) : 20150101_20160430_public_list.csv * 2016년 5월 이후 월별 생성(최초 신규 생성 일자:2016년 6월 1일 생성)
- 구성 : /분야명+'_'+종류
- 예시
- 결재문서 : info_list
- 사전정보공표목록 : public_list
- 정책연구자료목록 : research_list
- 구성 : 기준연월일(from)+'_'+기준연월일(to)+'_'+분야명+종류+'_'+(필요시설명)+'.'+확장자
- 예시
- 결재문서 : 20150301_20150331_info_list.csv
- 사전정보공표목록 : 20150301_20150331_public_list.xml
- 정책연구자료목록 : 20150301_20150331_research_list.xlsx
- 파일 유형별 특이사항
- *.csv : UTF-8로 인코딩 되어 있어, 엑셀 활용시 데이터 > 외부 데이터 가져오기 > 텍스트로 불러와야 한글이 정상적으로 표출됨. (엑셀의 한계)
- *.json : 문자는 인코딩 되어 있어, 변환(decode)하여 사용해야 함.
-
결재문서
- package_id : 문서관리번호(PK)
- doc_prdctn_dt : 자료생산일자
- trck_card_nm : 단위과제카드명
- title : 제목
- src_dept_doc_id : 문서번호 (예: 정보공개정책과-1234)
- writer : 담당자
- othnd_pd : 문서보존기간(1년, 3년, 5년, 10년, 30년, 준영구, 영구)
- dept_nm : 부서명
- othbs_se : 공개구분코드(공개,부분공개,비공개)
- cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND ), nullable
- url : 원문공개URL, nullable
- 주의사항 :cpyrht,url은 원문공개중인 경우만 해당 정보가 존재함.
-
사전정보공표목록
- nid : 관리번호(PK)
- category : 분야
- title : 제목
- writer : 담당자
- dept_nm : 부서명
- regist_dt : 등록일시(정보소통광장 등록일시)
- taxonomy : 업무상세분류(1단계~4단계)
- telno : 전화번호, nullable
- cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND )
- url : url
-
정책연구자료목록
- nid : 관리번호(PK)
- title : 제목
- regist_dt : 등록일시
- relm_cl : 자료유형(정책연구자료,논문,간행물,세미나)
- creat_yr : 생산년도
- category : 분야(복지, 여성가족, 경제, 안전, 주택도시계획, 환경, 문화관광, 건강, 교통, 건설, 세금재정, 행정)
- region : 관련지역(서울시 전체, 서울 25개 자치구, 수도권, 전국, 해외)
- isbn : ISBN, nullable
- relte_area : 원본시스템명
- writer : 담당자
- doc_prdctn_dt : 자료생산일자
- cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND )
- othbs_se : 공개구분
- job_se : 작업구분(I,U,D)
- url : url