Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

City is missing in metadata field while editing an ANP-text [SDBELGA-530] #438

Merged
merged 4 commits into from
Oct 3, 2023
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
14 changes: 14 additions & 0 deletions server/belga/io/feed_parsers/belga_anp_newsml_1_2.py
Original file line number Diff line number Diff line change
Expand Up @@ -80,7 +80,21 @@ def parse_newsitem(self, item, newsitem_el):
sorted(item["subject"], key=lambda k: k["qcode"])
)
]

# SDBELGA-530
if not item.get("extra", {}).get("city"):
item.get("extra")["city"] = self.extract_city(item)

return item

def extract_city(self, item):
"""
extract city from body_html
"""
location_match = re.search(r"([A-Z][A-Za-z ]+)\s*\(ANP\)", item["body_html"])
if location_match:
return location_match.group(1).strip()
return ""


register_feed_parser(BelgaANPNewsMLOneFeedParser.NAME, BelgaANPNewsMLOneFeedParser())
4 changes: 2 additions & 2 deletions server/tests/io/feed_parsers/belga_anp_newsml_1_2_test.py
Original file line number Diff line number Diff line change
Expand Up @@ -108,7 +108,7 @@ def test_content(self):
self.assertEqual(item["language"], "nl")
self.assertEqual(
item["extra"],
{"how_present": "Origin", "country": "NLD", "city": "UTRECHT"},
{"how_present": "Origin", "country": "NLD", "city": "San Mateo"},
)
self.assertEqual(item["keywords"], [])
self.assertEqual(item["type"], "text")
Expand All @@ -125,7 +125,7 @@ def test_content(self):
self.assertEqual(item["genre"], [{"name": "ECO", "qcode": "ECO"}])
expected_body = (
"\n\t\t\t\t\t\t\t\t<p>N i e u w bericht, vervangt: FNV staat alleen met ultimatum aan Post"
"NL</p>\n\t\t\t\t\t\t\t\t<p>UTRECHT (ANP) - FNV kondigt werkonderbrekingen aan bij PostNL,"
"NL</p>\n\t\t\t\t\t\t\t\t<p>San Mateo (ANP) - FNV kondigt werkonderbrekingen aan bij PostNL,"
" nadat de post- en pakketbezorger maandag niet inging op een ultimatum voor toez"
"eggingen over een nieuwe cao. De drie andere bonden die met PostNL onderhandelen"
" over een nieuwe cao, zien niets in actievoeren.</p>\n\t\t\t\t\t\t\t\t<p>FNV overlegt nog"
Expand Down
4 changes: 2 additions & 2 deletions server/tests/io/fixtures/anp_belga.xml
Original file line number Diff line number Diff line change
Expand Up @@ -56,7 +56,7 @@
</SubjectCode>
<Location HowPresent="Origin">
<Property FormalName="Country" Value="NLD"/>
<Property FormalName="City" Value="UTRECHT"/>
<Property FormalName="City" Value=""/>
</Location>
<Property FormalName="Keyword" Value="Tennis;TENNIS-NIEUWS-MEDVEDEV"/>
<Property FormalName="Keyword" Value="BRIEF"/>
Expand All @@ -83,7 +83,7 @@
<body>
<body.content>
<p>N i e u w bericht, vervangt: FNV staat alleen met ultimatum aan PostNL</p>
<p>UTRECHT (ANP) - FNV kondigt werkonderbrekingen aan bij PostNL, nadat de post- en pakketbezorger maandag niet inging op een ultimatum voor toezeggingen over een nieuwe cao. De drie andere bonden die met PostNL onderhandelen over een nieuwe cao, zien niets in actievoeren.</p>
<p>San Mateo (ANP) - FNV kondigt werkonderbrekingen aan bij PostNL, nadat de post- en pakketbezorger maandag niet inging op een ultimatum voor toezeggingen over een nieuwe cao. De drie andere bonden die met PostNL onderhandelen over een nieuwe cao, zien niets in actievoeren.</p>
<p>FNV overlegt nog met leden over de precieze omvang en lengte van de stakingen. Later deze week wordt bekend waar postbezorgers het werk neerleggen.</p>
<p>Andere betrokken bonden vinden het nog te vroeg voor stakingen. ,,Het is veel te snel om na vijf uur onderhandelen naar het actiemiddel te grijpen'', zei Anselma Zwaagstra van CNV. Ook BVPP en VHP2 zien meer heil in een hervatting van het overleg met PostNL aanstaande woensdag.</p>
<p>De drie bonden vinden het ook een brug te ver om juist in de drukke periode rond kerst en oud en nieuw acties te organiseren. Die kunnen PostNL dusdanig hard raken dat ook de werkgelegenheid bij het bedrijf in gevaar komt, waarschuwen ze in een gezamenlijke brief aan hun leden.</p>
Expand Down