paint-brush
የጤና እንክብካቤ ግዥ መረጃ የአቅራቢውን አስተማማኝነት ለመገምገም እንዴት ጥቅም ላይ እንደሚውል@textmining

የጤና እንክብካቤ ግዥ መረጃ የአቅራቢውን አስተማማኝነት ለመገምገም እንዴት ጥቅም ላይ እንደሚውል

Text Mining6m2024/12/22
Read on Terminal Reader

በጣም ረጅም፤ ማንበብ

ይህ ክፍል የጤና አጠባበቅ ግዥ መረጃን ውስብስብነት ያብራራል፣ በ TED መድረክ ብዙ ቋንቋ ተናጋሪዎች እና የሽልማት ሰነዶች ላይ ያተኩራል፣ እና የተዋቀረ የውሂብ ጎታ ለአቅራቢዎች ስጋት መገለጫ።
featured image - የጤና እንክብካቤ ግዥ መረጃ የአቅራቢውን አስተማማኝነት ለመገምገም እንዴት ጥቅም ላይ እንደሚውል
Text Mining HackerNoon profile picture
0-item

የአገናኞች ሰንጠረዥ

  1. አጭር እና መግቢያ

  2. ጎራ እና ተግባር

    2.1. የውሂብ ምንጮች እና ውስብስብነት

    2.2. የተግባር ትርጉም

  3. ተዛማጅ ሥራ

    3.1. የጽሑፍ ማዕድን እና የ NLP ምርምር አጠቃላይ እይታ

    3.2. በኢንዱስትሪ አጠቃቀም ውስጥ የጽሑፍ ማዕድን እና NLP

    3.3. የጽሑፍ ማዕድን እና NLP ለግዢ

    3.4. ከሥነ ጽሑፍ ግምገማ መደምደሚያ

  4. የታቀደ ዘዴ

    4.1. የጎራ እውቀት

    4.2. የይዘት ማውጣት

    4.3. የዞን ክፍፍል

    4.4. የሎጥ ንጥል ፍለጋ

    4.5. ብዙ መተንተን

    4.6. የኤክስኤምኤል ትንተና፣ የውሂብ መቀላቀል እና የአደጋ ኢንዴክሶች እድገት

  5. ሙከራ እና ማሳያ

    5.1. የአካል ክፍሎች ግምገማ

    5.2. የስርዓት ማሳያ

  6. ውይይት

    6.1. የፕሮጀክቱ 'ኢንዱስትሪ' ትኩረት

    6.2. የውሂብ ልዩነት፣ ባለብዙ ቋንቋ እና ባለብዙ ተግባር ተፈጥሮ

    6.3. የአልጎሪዝም ምርጫዎች አጣብቂኝ

    6.4. የስልጠና ውሂብ ዋጋ

  7. ማጠቃለያ፣ ምስጋናዎች እና ማጣቀሻዎች

2. ጎራ እና ተግባር

ይህ ሥራ በጤና አጠባበቅ ግዥ ላይ ያተኩራል፣ ይህም በሥነ ጽሑፍ ውስጥ ብዙም ያልተጠና ነው። የፕሮጀክቱ ዋና ግብ ለእያንዳንዱ የጤና እንክብካቤ አቅራቢ 'የአቅራቢ ስጋት መገለጫ' ተለዋዋጭ መፍጠር የሚያስችል መድረክ ማዘጋጀት ነው። እንዲህ ዓይነቱ መገለጫ የተለያዩ አመለካከቶችን የሚገመግሙ የተለያዩ 'ኢንዴክሶች' (ለምሳሌ የተወሰኑ ምርቶችን የማቅረብ አቅም፣ ጂኦግራፊያዊ ሽፋን) ገዥዎች ከአቅራቢው ጋር ውል ለመፈራረም ያላቸውን 'ስጋቶች' ያቀፈ እንዲሆን እንገምታለን። ይህም ‘እንዲህ ዓይነቱን መድኃኒት የሚያቀርቡት እነማን ናቸው’፣ ‘ለዚህች አገር ምን ያህል ማቅረብ ይችላሉ’ ወይም ‘እንዲህ ዓይነት መጠን ማቅረብ ይችላሉ’ የሚሉ ጥያቄዎችን በቀላሉ ለመመለስ ያስችላል። እንደነዚህ ያሉ ጥያቄዎች ብዙውን ጊዜ ለገዢው ውሳኔ ወሳኝ ናቸው. ሆኖም፣ አሁን ያለው የግዥ ሂደት መልስ ለማግኘት ብዙ ረጅም ሰነዶችን በእጅ በማጣራት ላይ የተመሰረተ ነው። ይህ በጣም ሀብት የሚፈጅ ሂደት ነው። ለመረዳት እንደሚቻለው፣ የዋና ግባችን ደጋፊ የተዋቀረ የጤና አጠባበቅ አቅራቢዎች ታሪካዊ የውል መረጃ ዳታቤዝ ይሆናል። ስለዚህ የፕሮጀክቱ ሁለተኛ ግብ እንዲህ ያለውን የመረጃ ቋት ማዘጋጀት እና በታሪካዊ የጤና እንክብካቤ ግዥ መረጃ መሙላት ነው። የመንግስት ግዥ መረጃ በጣም ሰፊ ቢሆንም፣ በሚከተለው ላይ እንደምናብራራው፣ ማዕድን ማውጣትና ማገናኘት ያለባቸው የተዋቀሩ፣ ከፊል የተዋቀሩ እና ያልተዋቀሩ የመድብለ ቋንቋ መረጃዎች አሉ። ስለዚህ የፕሮጀክቱ ዋና ስራ የቴክስት ማዕድን እና የኤንኤልፒ መፍትሄዎችን በማዘጋጀት ከፍተኛ መጠን ያላቸውን ያልተዋቀሩ የግዥ መረጃዎችን ወደ መረጃ ማውጣቱ የመረጃ ቋቱን መሙላት ነው። ስለዚህ የዚህ ጽሑፍ ግብ የእነዚህን የጽሑፍ ማዕድን እና የ NLP ዘዴዎች እድገት ሪፖርት ማድረግ ነው.

2.1. የውሂብ ምንጮች እና ውስብስብነት

ፕሮጀክቱ በአውሮፓ ህብረት መንግስታት ከህዝብ ግዥ ጋር የተያያዙ ፕሮጀክቶቻቸውን ለማሳተም ከሚጠቀሙት 'Tenders Electronic Daily' (TED) መድረክ የግዥ መረጃን ያነጣጠረ ነው። TED በዓመት ከ460,000 የሚበልጡ የጨረታ ጥሪዎችን እና የኮንትራት ሽልማቶችን በ26 የአውሮፓ ቋንቋዎች ያሳትማል፣ በ420 ቢሊዮን ዩሮ ዋጋ። እያንዳንዱ ጨረታ ወደ ብዙ 'ሎቶች' ሊከፋፈል ይችላል፣ ብዙው በጣም ትንሹ የውል ክፍል ነው። እያንዳንዱ ዕጣ ብዙ የሚፈለጉ ነገሮችን ሊይዝ ይችላል። እንደ ምሳሌ፣ የጨረታ ማስታወቂያ '2019/S 180-437985'[1] ከኤንኤችኤስ (ዩኬ) ጨረታ 47 ዕጣዎችን ይዘረዝራል፣ መጠኖቻቸው ከ2 እስከ 30 የሚደርሱ እቃዎች አሉት። አንድ ጨረታ ስኬታማ ጨረታዎችን ካረጋገጠ፣ ‘የኮንትራት ሽልማት’ (ወይም በርካታ ሽልማቶች) ተዘጋጅቶ በ TED ይመዘገባል። በሚከተለው ውስጥ፣ ለማብራራት ያህል፣ ለእያንዳንዱ ጨረታ አንድ ሽልማት እንዳለ እንገምታለን (ነገር ግን በተግባር ግን የእኛ ዘዴዎች ለጨረታ ለሚቀርቡት ሽልማቶች በሙሉ ይተገበራሉ)። በጨረታ የቀረቡትን እጣዎች ልብ ይበሉ እና የኮንትራት ሽልማቶች 'ከብዙ እስከ ብዙ' ግንኙነት ይመሰርታሉ። ይኸውም ብዙ ዕጣዎች ለአንድ አካል ሊሰጡ እና በአንድ የውል ስምምነት ውስጥ ሊመዘገቡ ይችላሉ; ብዙ የኮንትራት ሽልማቶችን በመፍጠር አንድ ነጠላ ዕጣ ለብዙ አካላት ሊሰጥ ይችላል ። ተጨማሪ የአንድ ውል ሽልማት አንድ ወይም ብዙ ዕጣዎችን ሊያካትት ይችላል.


በ TED ላይ፣ እያንዳንዱ ጨረታ እና ተዛማጅ የኮንትራት ሽልማቶች/ዎች የተዋቀሩ የኤክስኤምኤል ፋይል ቁልፍ የመረጃ ክፍሎችን የሚመዘግብ አላቸው። እነዚህን እንደ 'ጨረታ ኤክስኤምኤል' እና 'ሽልማት ኤክስኤምኤል' እንላቸዋለን። የጨረታ ኤክስኤምኤል ምሳሌ በስእል 1 ይታያል። የሽልማት ኤክስኤምኤልዎች በአጠቃላይ ተመሳሳይ መዋቅር ይከተላሉ። የጨረታ ኤክስኤምኤሎች እንደ ገዢው፣ ዕጣው፣ የዕጣው እቃዎች፣ የኮንትራት መመዘኛዎች፣ ወዘተ የመሳሰሉ መረጃዎችን ያቀርባል። ሽልማት ኤክስኤምኤል ገዢውን፣ ዕጣዎቹን፣ የተሸለሙትን አቅራቢዎች ለእያንዳንዱ ዕጣ፣ የውል ዋጋ፣ መጠን፣ ወዘተ. እያንዳንዱ ጨረታ እንዲሁ ሊኖረው ይችላል ስለ ጨረታው ተጨማሪ ዝርዝሮችን የሚያቀርቡ 'አባሪ ሰነዶች' ስብስብ፣ በተለይም በሎቶች እና እቃዎች ላይ ('የጨረታ አባሪ')


ምስል 1. የጨረታ የኤክስኤምኤል ምሳሌ ከTED የተቀነጨበ (የማስታወቂያ መታወቂያ 2020/S 050-119757)። የማስታወሻ ክፍል II.2.1 የተወሰነ ዕጣ እና እቃዎቹን ይዘረዝራል, II.2.5 ደግሞ የውል መስፈርቶችን ይዘረዝራል.


የጨረታ እና የሽልማት ኤክስኤምኤል መኖርን ከግምት ውስጥ በማስገባት ዳታቤዙን የማዘጋጀት እና የመሙላት ስራ ቀላል እንደሆነ ሊመለከተው ይችላል። ይሁን እንጂ በእውነታው ላይ ያለው መረጃ በጣም የተወሳሰበ ነው. በመጀመሪያ ደረጃ፣ የጨረታ እና የሽልማት ኤክስኤምኤሎች ብዙ ጊዜ ያልተሟሉ ናቸው። ዋነኛው የጎደለው መረጃ ብዙ እና የንጥል መረጃ ነው። እንደ ምሳሌ፣ የጨረታው XML የ'2019/S 180-437985'፣ በጨረታው ውስጥ 47 ዕጣዎችን ጠቅሷል፣ የተወሰኑትን ነገሮች ሳይዘረዝር ነገር ግን ብዙ የማጣቀሻ ቁጥር። ይህ ወሳኝ መረጃ ከ7 የጨረታ አባሪዎች (PDFs) በጅምላ ማውረድ ይገኛል። ሁለቱም የጨረታ እና የሽልማት ኤክስኤምኤሎች የዕጣ ማጣቀሻዎችን በመጠቀም እነዚህን የመረጃ ምንጮች ያቋርጣሉ። እንደነዚህ ያሉ መረጃዎችን መልሶ ማግኘት የአቅራቢውን ስጋት መገለጫ ለመገንባት ወሳኝ ነው፣ ይህም አንድ አቅራቢ ከዚህ በፊት ያቀረበውን የምርት መጠን እና መጠን ግምት ውስጥ ማስገባት አለበት። ሁለተኛ፣ እያንዳንዱ የጨረታ አባሪ ለዓላማችን ጠቃሚ አይደለም። ከ'2019/S 180-437985' መካከል፣ ሁለት ፒዲኤፎች ትክክለኛ ዕጣዎችን እና እቃዎችን ይዘረዝራሉ (ለምሳሌ፡ ምስል 2)፣ ሌሎች ደግሞ ዝርዝር መግለጫዎችን፣ መስፈርቶችን፣ ደንቦችን እና ፕሮቶኮሎችን ይመዘግባሉ። መረጃ. ለምሳሌ፡ ስእል 3 እንደሚያሳየው በሌላ ጨረታ ላይ ዕጣ እና እቃዎች በአንድ ገጽ ላይ ተገልጸዋል ነገር ግን የረዥም ሰነድ የተለያዩ ክፍሎች። አራተኛ፣ ቀደም ሲል በስእል 2 እና 3 እንደሚታየው፣ የእጣ እና የንጥል መረጃ በአንድ ሀገር ውስጥ እንዴት እንደሚገለፅ ወይም እንዲያውም ተመሳሳይ ድርጅት ውስጥ ትልቅ ልዩነት አለ። ይህ ልዩነት በተለያዩ ደረጃዎች ታይቷል: የተዋቀረ ቅርጸት አጠቃቀም (ለምሳሌ, ነፃ ጽሑፍ ከጠረጴዛዎች/ዝርዝሮች); ኢንኮድ የተደረገው የመረጃ መጠን (ለምሳሌ በስእል 2 ያለው ሠንጠረዥ ለእያንዳንዱ ንጥል 16 አምዶች (ባህሪያት) ይዘረዝራል) ለተመሳሳይ ምርቶች/አገልግሎቶችም ቢሆን፤ እና አወቃቀሮች የሚወሰዱበት የመዋቅር ፍቺ (ለምሳሌ የአምዶች ቅደም ተከተል እና ስሞች)። እንዲህ ዓይነቱ ከፍተኛ ውስብስብነት እና ወጥነት የጎደለው የጽሑፍ ማዕድን እና የ NLP ጥናቶች ወይም ለጤና አጠባበቅ ግዥ ማመልከቻዎች እጥረት ለነበረበት አንዱ ዋና ምክንያት ሊሆን ይችላል።


ምስል 2. የጨረታ '2019/S 180-437985' (NHS, UK) አካል የሆነ የአንድ ፒዲኤፍ አባሪ ቅጽበታዊ እይታ። ሥዕሉ የሠንጠረዡን አንዳንድ ዓምዶች ብቻ ነው የሚያሳየው፣በተወሰነ የገጽ ቦታ ምክንያት። እያንዳንዱ ረድፍ አንድን ንጥል ይገልፃል, አምድ 1 ግን ዕጣ ማጣቀሻዎችን (እንደ ቁጥሮች) ያመለክታል.


ምስል 3. የጨረታ ‘2020/S 111-270678’ (የጤና እና ማህበራዊ እንክብካቤ ዲፓርትመንት፣ ዩኬ) አካል የሆነ የአንድ ፒዲኤፍ አባሪ ቅንጭብጭብ። ስዕሉ የሚያሳየው የዕጣውን እና የእቃዎቹን ዝርዝር የያዘ የአንድ ፒዲኤፍ ሰነድ ገጽ ከፊል ብቻ ነው። የዋጋ አወጣጥ መረጃ በሌሎች ገጾች ላይ ይታያል።


ደራሲዎች፡-

(1) ዚኪ ዣንግ *፣ የመረጃ ትምህርት ቤት፣ የሼፊልድ ዩኒቨርሲቲ፣ ሬጀንት ፍርድ ቤት፣ ሸፊልድ፣ UKS1 4DP (Ziqi.Zhang@sheffield.ac.uk);

(2) Tomas Jasaitis, Vamstar Ltd., ለንደን (Tomas.Jasaitis@vamstar.io);

(3) ሪቻርድ ፍሪማን, Vamstar Ltd., ለንደን (Richard.Freeman@vamstar.io);

(4) Rowida Alfrjani, የመረጃ ትምህርት ቤት, የሼፊልድ ዩኒቨርሲቲ, ሬጀንት ፍርድ ቤት, Sheffield, UKS1 4DP (Rowida.Alfrjani@sheffield.ac.uk);

(5) አዳም ፈንክ፣ የመረጃ ትምህርት ቤት፣ የሼፊልድ ዩኒቨርሲቲ፣ ሬጀንት ፍርድ ቤት፣ ሸፊልድ፣ UKS1 4DP (Adam.Funk@sheffield.ac.uk)።


ይህ ወረቀት ነው። በ arxiv ላይ ይገኛል በ CC BY 4.0 ፍቃድ.

[1] https://ted.europa.eu/udl?uri=TED:ማስታወቂያ:437985-2019:ጽሑፍ:ኤን:ኤችቲኤምኤል፣ መጨረሻ የተደረሰበት፡ ህዳር 2022