Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Riksdagensdata: Dubbletter i wikidata. #51

Open
salgo60 opened this issue Oct 4, 2022 · 7 comments
Open

Riksdagensdata: Dubbletter i wikidata. #51

salgo60 opened this issue Oct 4, 2022 · 7 comments

Comments

@salgo60
Copy link
Owner

salgo60 commented Oct 4, 2022

Originally posted by @SchermanJ in #50 (comment)

Funderar om detta bara är fel på importen, men här kommer några dubbletter jag upptäckt på wikidata.

Motion till riksdagen
2021/22:3779
av Johan Forssell m.fl. (M)

Korrekt: https://www.wikidata.org/wiki/Q110533584
Inkorrekt dublett: https://www.wikidata.org/wiki/Q111743075

Motion till riksdagen
2021/22:4373
av Jakob Forssmed m.fl. (KD)

Korrekt: https://www.wikidata.org/wiki/Q111036653
Inkorrekt dublett: https://www.wikidata.org/wiki/Q111743076

Motion till riksdagen
2021/22:4355
av Linda Lindberg m.fl. (SD)

Korrekt: https://www.wikidata.org/wiki/Q110567166
Inkorrekt dublett: https://www.wikidata.org/wiki/Q111743077

Originally posted by @SchermanJ in #50 (comment)

@salgo60
Copy link
Owner Author

salgo60 commented Oct 4, 2022

@SchermanJ - udda med att Sveriges Riksdag dokument ID slutar med -

@Ainali några tankar?

@salgo60 salgo60 changed the title Funderar om detta bara är fel på importen, men här kommer några dubbletter jag upptäckt på wikidata. Riksdagensdata: Dubbletter i wikidata. Oct 5, 2022
@Ainali
Copy link

Ainali commented Oct 5, 2022

Kan datat ha ändrats? Jag noterar att tre i dina första exempel har knepig etikett och titel: https://w.wiki/5n5r

@salgo60
Copy link
Owner Author

salgo60 commented Oct 5, 2022

ping @SchermanJ

image

@SchermanJ
Copy link

Här är ett exempel där jag tidigare bara tog bort bindestrecket och på så sätt fick URL att fungera:
https://www.wikidata.org/wiki/Q111675322

@salgo60
Copy link
Owner Author

salgo60 commented Oct 5, 2022

Ok det intressanta är varför det blev fel och vi hittar övriga felen. Kollar du på listorna ovan verkar fler saker vara fel...

Gissar att det kan vara bra att fundera på om vi kan ändra reglerna i Wikidata med ex regexp och se om vi kan hitta fler fel...

Jag skall skriva upp på feedbacken till Riksdagens Öppna data att dom borde beskriva de världen identifieraren kan ha...

@Ainali
Copy link

Ainali commented Oct 5, 2022

Jag skall skriva upp på feedbacken till Riksdagens Öppna data att dom borde beskriva de världen identifieraren kan ha...

Är inte det redan bra beskrivet på: https://data.riksdagen.se/dokumentation/sa-funkar-dokument-id/

@salgo60
Copy link
Owner Author

salgo60 commented Oct 5, 2022

Kan vara jag ville ha regexp

Min vision är att ihop kopplingen blir mer automatisk och då känns regexp ett bra att berätta

  • det här är min identifierare
  • alla mina värden kan valideras med detta regexp
  • när saker ändras publiceras ett nytt regexp och helst kan man prenumerera på det

Skall vi skala detta med öppen data till > 200 myndigheter och 290 kommuner plus göra det i hela världen behövs bra mönster som gärna inte skall vara en sida med massa text på svenska...

Jag tycker att Riksdagens öppna data har massa kvaliteter men skulle kunna bli lite bättre

  • proffsigare helpdesk
  • 5 star data
  • klassificera på ämnen som kanske görs av enskild Riksdagsman och har ett kontrollerad vokabulär
  • klassificering av motioner etc på hållbarhets mål
  • publicera med TEI format precis som gör med historiska riksdagstrycket
    *...

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants