Medical Name Entity Recognition

On December 27, 2022

NER ဆိုတာ Name entity recognition ရဲ့အတိုကောက်ပါ။

သူ့ကို Natural Language Processing (NLP)မှာသုံးတယ်။

NLP ဆိုတာ လက်ရှိလူအများသုံးနေကြတဲ့ Translation တို့၊ Chatbot တို့၊ ဟိုနေ့က နာမည်ကြီးသွားတဲ့ ပုံပြင်ရေးတတ်တဲ့ ChatGPT တို့ကို မွေးဖွားတဲ့ ဘာသာရပ်ပါ။

NER က ဘာလို့အရေးပါလဲဆိုတော့ စာကြောင်းတစ်ကြောင်းမှာ ဘယ်အရာက လူလဲ၊ ဘယ်ဟာက ရက်စွဲလဲ ၊ဘယ်ဟာက အဖွဲ့အစည်းလဲ၊ စသဖြင့် ခွဲသိနိုင်ရင်

နောက်ပိုင်း အလုပ်တွေလုပ်ရအရမ်းမြန်ပါတယ်။ တစ်ခုနဲ့တစ်ခု ဘယ်လို ဆက်နွယ်နေလဲဆိုတာလည်း ရှာလို့ရတယ်။

Medical NER မှာဆိုရင် ရောဂါလက္ခဏာတွေ၊ သုံးတဲ့ ဆေးဝါးတွေ၊ ဖြစ်တဲ့ရောဂါတွေ၊ လုပ်ထားတဲ့ Lab test တွေစတာတွေကို ဆွဲထုတ်ဖို့ ဖြစ်နိုင်ပါတယ်။

အင်္ဂလိပ်စာမှာဆိုရင် ဘယ်ဟာက နာမည် ဘယ်ဟာက အဖွဲ့အစည်း ဘယ်ဟာက ကုမ္ပဏီစသဖြင့် အများကြီးခွဲသိနေပါပြီ။

အဲလို သိဖို့ စကြရတာက လွန်ခဲ့တဲ့ အနှစ် ၂၀ ကျော် ၃၀ လောက်ကပါ။ စစတုန်းက လူတွေက စာလုံးတွေကို လိုက်ပြီး label တပ်ပေးရတယ်။ အလွန်လည်းလက်ဝင်တယ်။

အခုတော့ အဲဒီလူတွေ label တပ်ခဲ့တဲ့ အရာတွေကို နောက်လူတွေက အသုံးပြုပြီး အလိုအလျောက် entity တွေဆွဲထုတ်နိုင်နေကြပြီ။

Fb က ကိုယ်ပြောတာတွေသိတယ်တို့ ဘာတို့ဆိုတာတွေရဲ့နောက်ကွယ်မှာ NER ရဲ့လက်ချက်တွေလည်း အများကြီးပါတာပေါ့။

ကိုယ့်ဘာသာ

NER model လုပ်ဖို့ ဆိုရင်တော့ အရင်ဆုံး data ရှာရတာပဲ။

ကိုယ့်ဆီမှာ ဒေတာဆက်ကောင်းကောင်းမရှိဘူး။

မြန်မြန်အလုပ်ဖြစ်တဲ့နည်းကတော့ Regular expression သုံးပြီး

keyword တွေလိုက်ရှာ ၊ အဲဒါတွေကို train data အဖြစ်ပြန်သုံးတဲ့ဟာပဲ။

အကောင်းဆုံးကတော့ လူကိုယ်တိုင် တခုချင်း စာလုံးတွေကိုလိုက်ဖတ်။

ဘယ်ဟာက တော့ ရောဂါလက္ခဏာ ၊ ဘယ်ဟာက ဆေး၊ ဘယ်ဟာက ရောဂါ စသဖြင့် ခွဲထုတ်ပေးဖို့ပေါ့လေ။ အဲဒီလို လူအင်အားသုံးထားတဲ့ annotated dataset က quality အကောင်းဆုံးပဲ။

ဒီနေ့ အဲဒီလို Regex သုံးထားတဲ့ dataset နဲ့ Google Colab ပေါ်မှာ train တာ နေ့တဝက်ကျိုးတယ်။

Free version ကတော့ဘယ်လိုမှသုံးလို့မရဘူး။

ခဏလေးနဲ့ Memory ကုန်သွားတယ်။

အဲဒါကြောင့် သူ့ရဲ့ pro service ကိုဝယ် သုံးပြီးဆက် train ရတယ်။

မော်ဒယ်ကတော့ထွက်လာပြီ။

ဆိုးတော့မဆိုးဘူးပဲလို့ ကိုယ့်ဟာကိုယ် တွေးတယ်။

Quality ဘယ်လောက်ကောင်းလဲ ဆိုတာ evaluate လုပ်ဖို့အတွက်ကတော့ စာမဖတ်ရသေးလို့ မလုပ်တတ်သေးဘူး။

ပထမ တဆင့် အောင်မြင်သွားတယ်ဆိုတော့ ၊နောက်ပိုင်း quality ပိုကောင်းအောင် ဘာလုပ်လို့ရမလဲ စဉ်းစားလို့ရတာပေါ့။

မြန်မာလို NER ကိုလည်း ကျောင်းပိတ်ချိန် စမ်းကြည့်ဖို့ တေးထားတယ်။

ပုံ၁က သူများ ဖန်တီးထားတဲ့ dataset ကို train ပြီးရတဲ့ result.

ပုံ၂က ကိုယ့်ဘာသာ ဖန်တီးထားတဲ့ dataset ကို train ပြီးရတဲ့ result

အိမ်

အခု မီမီဝင်းဖေရဲ့ အမှတ်တရ ဆိုတဲ့သီချင်းရဲ့ remix ကိုနားထောင်နေရင်းနဲ့ ဟိုးအရင်က အတိတ်တွေကို ပြန်တွေးမိတယ်။ (ဒီသီချင်းကို နားထောင်မိပြီးသတိရမိတဲ့အကြောင်းကဘာရယ်တော့မဟုတ်ပါဘူး၊ငယ်စဉ်ကာလက အရမ်းကြားဖူးခဲ့တဲ့သီချင်းဖြစ်နေလို့ပဲ) အသက် ၃၀ ကျော်လာတဲ့ ကာလအတွင်းမှာ ဖြစ်ခဲ့တာတွေက အရမ်းများသလိုပဲ။ နေခဲ့တဲ့ နေရာတွေ အိပ်ခဲ့ရတဲ့နေရာတွေကလည်း အရမ်းများတယ်။ တချို့ဟာတွေဆိုသေချာမမှတ်မိတော့ဘူး။ မိဘနဲ့ စအိပ်ရာခွဲအိပ်ခဲ့တာ အသက် ၁၀ နှစ်မပြည့်ခင်ထင်တာပဲ။ အိမ်က အကြီးကြီးမဟုတ်ပါဘူး။ သေးသေးလေး၊ ကိုယ် မမွေးခင်တုန်းက လက်ဖက်ရည်ဆိုင်ဖွင့်ခဲ့သေးတယ်ဆိုတယ်။ အဲဒီလို ဆိုင်မကျ အိမ်မကျ နေရာလေးမှာပဲ ဟိုနား အခန်းကန့်လိုက် ဒီနားအခန်းကန့်လိုက်နဲ့ လုပ်ပြီး အသက် ၂၀ ကျော်တဲ့အထိ နေလာခဲ့တာ။ ၁၀ နှစ်ကျော်မှာ ဧည့်ခန်းထဲကို ကုတင်ထုတ်ပေးတာကို မှတ်မိသလိုလိုရှိတယ်။ နောက်တော့ အဲဒီနားမှာ လိုက်ကာ လေးတွေကန့်ပေးပြီး […]

သင်္ကြန်

သင်္ကြန်မရှိတဲ့ ဒေသမှာ နေလာတာ ၃ နှစ် ကြာလာပြီးတဲ့နောက် ဒီကာလတွေရောက်ရင် အိမ်လွမ်းဆွတ်စိတ်က အရင်ထက်အများကြီးပိုပါတယ်။ ကိုယ်တိုင်ပါဝင် ဆင်နွှဲလို့မရပေမယ့် ဟိုးအရင်က memory တွေ ပြန် ခေါ်ဖို့ ကြိုးစားကြည့်တာလည်း ကိုယ်တိုင် သင်္ကြန်ပြန်ရောက်သွားသလို ခံစားရမယ်ထင်တယ်။ အစောဆုံး သင်္ကြန်နဲ့ပတ်သက်တဲ့ မှတ်ဉာဏ်တွေက ၂၀၀၀ ခုနှစ်ဝန်းကျင်မတိုင်ခင်မှာရှိမယ်ထင်တယ်။ ၁၉၉၅ ကနေ ၂၀၀၀ ကြား အဖြစ်အပျက်တော်တော်များများကို မမှတ်မိတော့ဘူး။ အဲဒီအချိန်က ပျဉ်းမနားမှာ မိသားစုတွေအားလုံးစုနေကြတဲ့ တစ်ဧက နီးပါးကျယ်တဲ့ ခြံကြီးရှိတယ်။ အဲဒီမှာ အမေရဲ့ မောင်နှမတွေဖြစ်တဲ့ ဦးလေး အငယ်ရယ် အကြီးရယ်၊ အဖွားရယ်နေကြတယ်။ အဓိက အဆောက်အဦးက နှစ်ခုရှိတယ်။ သက်တမ်းက ၁၀၀ နီးပါးရှိလောက်မယ့် ရှေးတိုက်ကြီးထင်တာပါပဲ။ အုတ်တွေက အတော်ထူတယ်။ အဖွားနဲ့ဦးလေးအငယ်က အပေါ်ထပ် […]

လွန်ခဲ့တဲ့ ၁၀နှစ်က..

လွန်ခဲ့တဲ့ ၁၀နှစ်ကို ပြန်ကြည့်လိုက်ရင် ကိုယ်ရခဲ့တဲ့ အတွေ့အကြုံတွေ၊ အမှတ်တရတွေက မနည်းဘူး။ အပြောင်းအလဲတွေကလည်း ခဏခဏပါပဲ။ အိုင်တီလောက ထဲကို ခြေလှမ်းစလှမ်းခဲ့တာ ၂၀၁၂ လောက်တည်းကလို့ ပြောလို့ရမယ်ထင်တယ်။ အဲဒီတုန်းက မိုဘိုင်းGroup တွေမှာ စပြီး ကူတာတွေလုပ်နေပြီ။ Root ဖောက်၊ မြန်မာစာထည့်ဘာညာပေါ့လေ။ Samsung Galaxy S2 လေးတစ်ခုရှိတာ မျောက်အုန်းသီးရသလိုပဲ။ ၂၀၁၃ လောက်မှာ ဘွဲ့ရပြီးတော့ အိမ်ပြန်နေတယ်။ ကျောင်းနေဘက် သူငယ်ချင်းတွေ ဆေးရုံမှာ၊ ဆေးကုမ္ပဏီမှာ၊ နာမည်ကြီး NGO တွေမှာ လုပ်နေကြတာမြင်တော့ အားကျပေမယ့် ကိုယ်မလုပ်ချင်တဲ့အရာမှန်း သိနေလို့ ဘာမှမလုပ်ဖြစ်ဘူး။ ၆နှစ်လောက် ဝေးကွာနေတဲ့ မိသားစု နဲ့ အေးအေးဆေးဆေးနေတယ်။ MPT ရဲ့လိပ်လိုနှေးတဲ့ internet ကိုလျှောက်၊ ကိုယ့်အတွက် အပိုင်စားရထားတဲ့ […]

Camp in US

US က တိုးတက်တဲ့အပိုင်းတွေ ကတော့ ထူးထွေ ပြောနေစရာမလိုပါဘူး။ ပြည်တွင်းစစ်ပြီးကတည်းက တစ်ခြားနိုင်ငံတွေကိုသာ သွားစစ်တိုက်နေတာ။ သူ့နိုင်ငံထဲမှာ စစ်မဖြစ်တာကြာခဲ့ပြီ။ ဒါကြောင့် သူတို့လုပ်ချင်တဲ့ အရာအားလုံးကို အသေးစိတ်အထိ အေးအေးဆေးလုပ်ခွင့်ရကြတယ်။ ဆောက်လိုက်၊ အာဏာသိမ်းလို့ပျက်လိုက်၊ စစ်ဖြစ်လို့ ပျက်လိုက်ဆိုတာမရှိဘူး။ ဒါကြောင့် များသောအားဖြင့် သူတို့ရဲ့ အဆောက်အအုံတွေတော်တော်များများ ရဲ့ရာဇဝင်က အနည်းဆုံး ၁၈၀၀ ကျော် ကာလတွေကတည်းကစပြိး အခုထိဒီတိုင်းထားလေ့ရှိတယ်။ ဒီတစ်ခါရေးဖို့စိတ်ဖြစ်တာက ပြည်နယ်ဥယျာဉ် တွေ ,အမျိုးသားဥယျာဉ် တွေအကြောင်းပါ။ ဒီက ဥယျာဉ်ဆိုတာ ဘလောက်တစ်ခုစာအပြည့် ရှိပြီးရေကန်တွေ၊ သစ်ပင်တွေ၊အနားယူစရာ ပျော်ပွဲစားထိုင်ခုံတန်းတွေပါသလို ကြီးတဲ့အခါ မြို့တစ်ခုစာ ပြည်နယ်တစ်ခုစာအထိ ဥယျာဉ် လို့သတ်မှတ်ထားတာမျိုးလည်းရှိတတ်ပါတယ်။ မနှစ်ကတော့ Yellowstone ကို သွားခဲ့တယ်။ သူက စတုရန်းမိုင် ၃၀၀၀ ကျော် ကျယ်တယ်။ […]

Yellow Stone သို့တစ်ခေါက်

Camp ထိုးတာကို နှစ်ခါကြုံဖူးတယ်။ အရင်က ထင်ထားတာက camp ထိုးတယ်ဆိုတာ မြို့ပြနဲ့အဝေးကြီး၊ တောအုပ်ကြီးထဲမှာသွားထိုးကြတာလားပေါ့လေ။ တကယ့်တကယ်ကျတော့ အဲဒီလောက်လူတွေနဲ့ အဝေးကြီးမဟုတ်ပြန် ။Camp ground တွေကို အွန်လိုင်းကနေ ငှားထားလို့ရတယ်။ တောအုပ်ကြီးထဲမှာ camp ထိုးတဲ့သူတွေ နေလို့ရဖို့ ပြင်ဆင်ပေးထားတဲ့ သီးသန့်နေရာပေါ့။ ဒါကြောင့် ကြုံရာနေရာမှာထိုးနေရတာမျိုးတော့မဟုတ်ဘူး။ တကယ့် adventure ကြိုက်တဲ့သူတွေဆိုရင်တော့ ဘယ်သူမှမပြင်ဆင်ပေးထားတဲ့နေရာကို ကိုယ့်ဘာသာ သွားထိုးရင်လည်းရရင်ရမှာပေါ့။ risk တော့ပိုယူရလိမ့်မယ်။ အခုလို ပြင်ဆင်ပေးထားတဲ့နေရာတွေမှာဆိုရင်တော့ ကိုယ့်လိုပဲတခြားလူတွေလည်းမနီးမဝေးမှာရှီနေလိမ့်မယ်။ Yellostone campground ကိုရောက်တော့ ဘေးမှာ အာရှသားမိသားစုတစုလည်းရှီတယ်။ သူတို့ကြည့်ရတာ ဂျပန်တွေနဲ့ပိုတူတယ်။ အဓိကကတော့ တိတ်တိတ်ဆိတ်ဆိတ် နေတတ်လို့ အဲဒီလို ကောက်ချက်ချမိတာပဲ။ ရောက်ရောက်ချင်းမှာတော့ ကိုယ်နေမယ့် ရွက်ဖျင်တဲလေးတွေကို ကိုယ့်ဘာသာ ပြင်ဆင်ရတယ်။ ရွက်ဖျင်တဲ တခုစာအတွက်အိတ်လေးနဲ့ […]

Many Lives, Many Memories.

Medical Name Entity Recognition

Related

Related

Discover more from Arthur's Home