Matchning i arbetsmarknaden har allt blivit hårdare sedan det är svårt för företag att hitta personer med rätt kompetens och större andel av arbetssökare står långt från arbetsmarknaden av olika orsaker. Användning av teknologi som stöd i matchningen har varit gjord dem senaste 10 åren av olika aktörer med olika resultat och bredd. I detta bildspelet försöker jag göra redo för olika algoritmer och metoder som om dem blir integrerad på rätt sätt och använd på rätt sätt, ge båda den arbetssökande och inte minst företagaren mycket större chans att matcha behöv för båda med större grad av succés en man gör i dag.
2. Du vill minska risk att göra en felanställning.
Du vill öka chans för att ditt företag blir bättre med
den nyanställde.
Du vill minska kostnad med rekrytering.
Du vill vara pro-aktiv och inte bara respondera när
behov kommer.
Du vill vara framför dina konkurrenter om att hitta
dem rätta personer till jobben som du behöver om
6 månader och inte bara i dag.
Du vill vara den som vinner på arbetsmarknaden.
Du vill ha en klon av den arbetaren som du tycker
fungerar bäst hos dig redan i dag.
3. En fungerande arbetsmarknad
Etablerade samarbete mellan parter
Rekrytering blir mer prediktiv
Ett prediktivt arbetssökande
Träff rätt kompetens till behov
Kostnadseffektivt för samhället
Färre rekryteringslistor – fokus & effektivitet
Rätt person till rätt jobb
4. Personal avdelningar kör gamla lösningar.
Programvara byggt för personal ledning.
Outsourcing har blivit norm, det kostar!
Existerande lösningar kopplar inte jobb med
rätt person på rätt plats till rätt tid.
Oförutsedda lösningar och inte prediktiva.
Dagens system är inte pro-aktiva, bara byggt
för att reagera när situation uppstår.
Existerande lösningar hittar inte
rätta personer till rätt jobb
5. För att förutse behov och vad som behövs i
arbetsmarknaden behövs det två saker.
Prediktiva jobb matchning system
Erfarenhet
Personlighet
Erfarenhetärmeriterochutbildning
Personlighet är motivationoch kulturanpassning
Mycket bättre med prediktiv
lösning istället för använda
bara meriter och intervju.
6. Anställningschefer vill inte annonsera jobb och
arbetssökande vill inte söka jobbannonser.
Båda vill ha en trollstav som direkt ansluter rätt personer
med rätt jobb genom att förutsäga match och när behov
är där.
Detta kallas Prediktivt Jobb Matchning.
Vem hoppar först?
7. Du identifierar attributen för dina mest produktiva och topprankade
medarbetare i vilken roll som helst, i vilket team som helst och använder dessa
som referensdata för att anställafler anställdasom delar dessa vinnande
attribut.
System vill identifiera omedelbart vilka sökande som sannolikt kommer att
lyckas enligt dina kriterier.
Det har visat sig vara mer effektivt att förutsäga framgång än traditionell
anställning metod som används i dag.
Systemet måste ha etablerad ett nätverk av relevanta jobb översikter/ listor
och söker efter rätt kandidater och att dessa ser din jobbannons.
Ett system som har en beskrivning guide baserad på etablerade jobb
beskrivningar som finns på marknaden och skapade ontologimönstren
kommer att skapa den optimala arbetsbeskrivningensom arbetar inom
arbetsmarknaden för att hitta rätt arbetssökande.
Prediktiv matchning
8. Många söker den optimala algoritm för att göra det bästa
jobbmatch möjligt.
Många hävdar att hittat den optimala lösningen.
Vilken algoritm är den då den bästa, eller finns den als?
Är frågan ställd fel – det är mer hur och vart algoritmenanvänds,
och inte bara algoritmeni sig själv?
Algoritm för bästa jobbmatch?
9. Topp företag inom Jobb matchning
på Linkedin
Jobb match resultat i dag
10. Vad och vem ska vi matcha?
Allt fler av de arbetslösa vid Arbetsförmedlingen tillhör grupper som behöver omfattandestöd och
rustning för att kunna konkurrera om de lediga arbetensom finns (står långt frånarbetsmarknaden).
I dag utgör till exempelarbetslösa som tillhör någonav grupperna nyanlända, personer somhar en
funktionsnedsättning som medför nedsatt arbetsförmågaeller med högst förgymnasialutbildning för
mer änhälften av alla arbetslösa.
Den alltmer tudeladearbetsmarknadenhar lett till en försämrad matchning.
Att effektivt sammanföra arbetssökande med arbetsgivarehar blivit mer komplex då allt färre av de
arbetssökandehar denkompetenssom efterfrågas.
Gruppenmed personer som står långt ifrån arbetsmarknaden bestårav:
• Nyanlända
• Funktionsnedsättning
• Bara förgymnasialutbildning
• 55+ år
Gruppenmed personer som står nära arbetsmarknaden är alla dem andra, och som i mindregrad
behöver stöd för att matchasi arbetsmarknaden.
Låt oss först se hur vi kan matcha gruppen somstår längst ifrån arbetsmarknaden först.
11. Längst från arbetsmarknaden
Del av gruppenmed personer som står långt ifrån arbetsmarknaden:
• Nyanlända
• Funktionsnedsättning
• Bara förgymnasial utbildning
• 55+ år
16.9%
33.8%
39.6% 26.6%
50.7
%
Källa: Arbetsförmedlingen
Låt oss se hur vi till exempel kan göra en matchning algoritm för personer med
funktionshinder. Denna algoritm kan anpassas andra faktor till denna gruppen.
12. Idén för en algoritm för matchning av arbetsuppgifter är att ställa in statistiska filterpå PAQ-föremål där prestanda skulle begränsas
av funktionshinder och att dela listan över närmaste jobbannonser beroendepå huruvidade passerade filtren eller ej.
PAQ använder en kontextblandningsalgoritm. Kontextblandning är relateradtill prediktering genom partiell matchning (PPM)
genom att kompressorn är indelad i en prediktion och en aritmetisk kodare, men skiljer sig ifrån att nästa symbolförutsättning
beräknas med användning av en vägd kombination av sannolikhetsestimat från ett stort antal modeller Konditioneras i olika
sammanhang. Till skillnad från PPM behöver ett sammanhang inte varaangränsande.
De närmaste matchande jobb som passerar filtren är listadei ett avsnitt i rapporten. De närmaste matchandejobb sominte passerar
filtren anges i en annan del av rapporten.
Några jobb kan avvisas som otänkbara, men vissa kan rimligen rymmas.Om en persons ryggsmärta hindrar att sitta mer än en timme
så kan yrkesspecialisten programmera WRQ för att skriva ut en lista över jobbsom krävermer än en timmes sittande i en del av
rapporten och jobb somkräver en timme eller mindre av sittandei en annan del av rapporten.
Ange en produktgräns på utbildning till exempel, rapporten delas i en lista överjobbsom krävermer utbildning och en annan lista
över jobb som kräver samma eller lägre utbildning än gränsen.
Eftersom WRQ består av många objekt kan objektgränser ställas in för att modellera praktiskt taget alla nedskrivningareller
begränsningar. När en person har allvarliga begränsningar somkan innefatta utbildningsbegränsningar ellertill och med motvi lja
mot att utföra vissa arbetsuppgifter, kan WRQ ta hänsyn till dessa. Storleken på skillnaden mellan en produktgräns och ett jo bbkrav
som överstiger objektgränsen kan avgöraom jobbet är oförlåtligt eller om det rimligen kan hysas.
Den grundläggande statistiska principen somanvänds i WRQ-matchning är maximal sannolikhetsbedömning, vilketär en metod för
att jämföra olika uppsättningar data.
WRQ-matchningsalgoritmen använderen icke-parametrisk "ovägd multivariat närmastegranne"-metod.
Matchning - funktionshinder
13. Detta är det mest kända kvantitativatillvägagångssättet för arbetsanalys somär lägesanalysformuläret (PAQ).
Metodär utveckladav Dr. Ernest J. McCormick som associerade vidPurdue University. Dettapositionsanalysformuläret är ett
strukturerat arbetsanalysformulär sominnehåller 194 poster som heter jobbelement. Dessa element är arbetarorienterade. Med
hjälp av terminologin för Arbetsförmedlingsavdelningens1972-arbetsanalysformelskulle de klassificerassomarbetarnas beteenden.
Föremålen är organiserade i sex divisioner:
informationsinmatning
mentala processer
arbetsutgång (fysiskaaktiviteter ochverktyg)
relationer med andra
arbetskontext(denfysiskaochsocialamiljön)
andra jobbegenskaper (såsom takt och struktur)
Varje jobbelement är betygsatt på sex skalor:användningsgrad, betydelse, tid, möjlighet att uppträda, tillämpbarhet och en särskild
kodför vissa jobb.
Dessa beskrivare strömmar frånMcCormicksmodellav operativafunktioner som är grundläggande för alla jobb: sensing
(informationsmottagning), informationslagring, informationsbehandling och beslut och handling (fysisk kontrolleller
kommunikation).
Dessa funktioner varierar ibetoning från jobb till jobb.
Användning av PAQalgoritm med dessa uppdelningar som visas, vill ge oss en chans att matcha jobb och sökande i bättre grad en
tidigare. Om vi går vidare ochanvänder några av algoritmer som visas på dem nästa bilden, så kan sökandet ochmatchningen bli
optimal. Detta kräver att vi arbetar upp en ordentlig matris av kunskap, färdigheter ochförmågor. Integrerad med faktorer som
fysisk krav ocharbetsmiljö villvi ha en möjlighet att ge stödtill arbetsgivare för personer somkan göra olika jobb om man bara vet
vilkenram vi arbetar inom.
Position Analysis Questionaire (PAQ) Arbetsanalys
14. WRQ är ett statistiskt verktygför att stödja kliniskt beslutsfattande när det gäller arbetspotentialför personer med funktionshinder.
Arbetsgivare kananvända WRQ för att stödja val eller placering av kvalificerade personer medfunktionshinder.
Det kan användas för att stödjatvister om yrkesfrågor.
Programmering av WRQ kan används för att övervägafunktionshinder i arbetsmatchning.
De 150 PAQ/ WRQ-jobbelementen täcker ett så brett utbud av arbetsaktiviteter medyrkesmässigakonsekvenserna ochpraktiskt
taget alla funktionshinder kan modelleras.
Specialisten specificerar vilkenPAQ-funktionshindersbegränsningsom begränsar prestanda ochanger sedan objektgränser för att
indikera maximal prestanda på dessa objekt.
Inställningsbegränsningar programmerar WRQ för att ta hänsyn till funktionshinder.
När jobbsökningsalgoritmenkörs, påverkar effektenav objektgränser ochdelar upp den jobbrelaterade rapportentill en lista över
närmaste matchningsjobb där inga PAQ-värdenöverskrider objektgränser och enlista för närmaste matchande jobb där PAQ-värden
överskrider objektgränser.
Programmera WRQ för att ta hänsyn till funktionshinder
Jobb K är närmare WRQ-betygpå individen än
Jobb J, eftersom4 är mindre än 5.
15. Vi ska nu gå igenom flera olika typer algoritmer som kan används för matchning eller informationssök inom en
jobb databas.
Flera av dessa algoritmer används redan inom olika rekryteringsbyrå och deras programvara för att matcha jobb
och arbetssökande.
Andra algoritmer används inom internetbaserade tjänster inom handel och så vidare.
I slutet av bildserien vill vi presentera det vi tror är metoden som borde ha preferens när det gäller matchning
inom arbetsmarknaden och möjliggör att arbetssökande och företagen hittar varandra i rätt tid.
Olika algoritmer
16. Metoden för Jobb Latent Semantisk Indexering(JLSI) föreslås som ett förstatillvägagångssätt.
I grund och bottenanvänder JLSI Latent Semantisk Indexering(LSI) somgrund för informationshämtning i jobbet inom
matchningsområdet.
Det här är en anpassning av befintlig teknik när det gäller att tillämpa ett nytt arbetssätt.
Arbetspassningsalgoritmen förbättrassedanytterligare som JELSI-metoden ”Job Enhanced Latent Semantic Indexing” genom
att inkorporera ”TermFrequency Inverse Document Frequency”.
JELSI tar hänsyn till den lokalaviktenoch den globala viktenav begreppet frekvensihela samlingen.
Radreduktionsteknik har införts för att minska de obetydligatermerna (radvektorer)imatrisen för att minska
beräkningsinsatser ochtid.
Inkorporerafeedback frånarbetssökande att erbjudaett bättre jobbmatchningsmekanism.
Feedback från arbetssökande är när det gäller arbetsapplikationsbeteenden.
I allmänhet förbättrar återkopplingalgoritmfrågani varje pass baserat på resultaten från tidigare frågor.
Detta uppvisar fördelarnamed Kollektivt Lärande (KL, på engelska Collective Learning – CL) där en grupp arbetssökande
hjälper till att fatta beslut.
De kollektivafeedbackensättsin i algoritmen och resultaten förbättras.
JELSI-CL är metoden som ger bäst resultat sedan den kollektivalärningsprocessökar träffsäkerhet tillsystemet.
Rekrytering webbplatser strävar fortfarande efter att förbättra deras jobbmatchning program för bättre
prestanda i noggrannhet och relevans i matchningen.
Vid att öka träffsäkerheten kommer detta att förbättra anställningsförloppet och minska anställningstiden
och kostnaden för företagen.
Matchning med kollektivt lärande
17. Metoden för latent semantisk indexering (JLSI) föreslåsförst som ett förstatillvägagångssätt.
I grund och bottenanvänder JLSI latent semantisk indexering som grund för informationshämtning i jobbet inom
matchningsområdet.
Det här är en anpassning av befintlig teknik när det gäller att tillämpa ett nytt arbetssätt.
Arbetspassningsalgoritmen förbättrassedanytterligare som JELSI-metoden ”Job Enhanced Latent Semantic Indexing” genom
att inkorporera ”TermFrequency Inverse Document Frequency”.
JELSI tar hänsyn till den lokalaviktenoch den globala viktenav begreppet frekvensihela samlingen.
Radreduktionsteknik har införts för att minska de obetydligatermerna (radvektorer)imatrisen för att minska
beräkningsinsatser ochtid.
Inkorporerafeedback frånarbetssökande att erbjudaett bättre jobbmatchningsmekanism.
Feedback från arbetssökande är när det gäller arbetsapplikationsbeteenden.
I allmänhet förbättrar återkopplingalgoritmfrågani varje pass baserat på resultaten från tidigare frågor.
Detta uppvisar fördelarnamed kollektivt lärande (CL) där en grupp arbetssökande hjälper till att fattabeslut.
De kollektivafeedbackensättsin i algoritmen och resultaten förbättras.
JELSI-CL är metoden som ger bäst resultat sedan den kollektivalärningsprocessökar träffsäkerhet tillsystemet.
Rekrytering webbplatser strävar fortfarandeefter att förbättraderasjobbmatchning program för
bättreprestandai noggrannhet och relevansi matchningen.
Vid att öka träffsäkerhetenkommer dettaatt förbättraanställningsförloppetoch minska
anställningstidenoch kostnadenför företagen.
Matchning med kollektivt lärande
18. Hämtningsstrategi är en algoritm som kan identifiera likheten mellan en uppsättning dokument ochen fråga.
Graden av likhet mellan frågan och dokumententilldelas normalt av likhetsmätningen som cosinuslikhetsmätning och
korrelationskoefficientmetoder.
Detta kan baseras på de gemensamma delarna som finns i både dokumentenoch frågornaför att bestämma deras likhet.
Vanligtvisjo mer villkor som delas mellan dokumenten ochfrågan, desto mer relevantakommer dem sannolikt att vara.
Hämtningsstrategi
Det är en idealisk modell för rankning av hämtning av resultat.
I vektorrymdmodellrepresenterasbåde frågornaochdokumenten som vektorer idet högre dimensionella utrymmet.
Vektornkanbestå av tvåeller flera termer.
I detta fallanvänds termerna i vektornför att representerabetydelsenav ett dokument.
Om man kan representeravillkoreni dokumenten som vektorer, är det möjligt att jämföra dokumenten ochfrågornaför att
bestämma hur liknande de är.
Vanligtvisbestäms likheten hos vektorernagenomatt beräkna vinkelnmellan vektorernaidet högre dimensionella utrymmet.
Dess mindre vinkeln mellan vektorernaär,desto mer relevanta är matchen.
Beräkningen utförsgenom att använda cosinuslikhetsmätningen eller punktprodukten.
Vektor rum modell
19. Boolean hämtning är en modell som bygger på uppsättningsteori eller boolesk algebra.
Det är en välkändmodell som används av många människor under de senaste åren tack vare sin enkelhet.
Använder det binära beslutskriteriet för att bestämma om detta är antingen matchning eller inte en matchning.
Detta gör att den booleskahämtningen är en rakt framåthämtningsmetod.
Boolean hämtning returnerar uppsättningar resultat och inte rankade listor.
Vanliga online-rekryteringswebbplatser använder denna modell ganska mycket. I den här modellen hämtar vi dokument
med hjälp av indexvillkoren. I det här fallet består sökningen av indexvillkoren kopplade till de standard booleanska
operatörerna AND, NOT ochOR.
Boolean hämtning
Kluster modellen kan grupperadataobjekt uteslutande på informationen som härrör från data som beskriver objektenoch
deras relationer.
Huvudmålet med gruppering är att gruppera objekt som liknar varandraoch de skiljer sig från objekteni andra grupper.
Kan delas upp i 2 huvudkategorier nämligen hierarkisk ochicke-hierarkisk klustringeller partitionklustring.
Hierarkisk klustring kan vidare indelas i 2 olikaalgoritmiska strukturer somantingen är uppifrån (agglomerativa)eller
uppifrån (delande).
Det finns några metoder för att göra den hierarkiskaklustringen.
Icke-hierarkisk klustringdelar upp dataobjekteni globala kluster, så det finns inga överlappande deluppsättningar.
Icke-hierarkisk kluster har bättre prestanda för stora data set.
När det finns extremvärden, kankluster resultaten inte varabra ochvi behöver normalt att bestämma det ursprungliga antalet
kluster som indata parameter för icke-hierarkisk klustringatt genomföra.
Kluster
20. Är en av de mest använda icke-hierarkiskaalgoritmernapå grund av dess effektivitet.
Baserat på oövervakat lärande eftersom det kan hitta den dolda strukturen i omärkt data eller göra naturlig gruppering.
K-medel använde en kvadrerad felmetod. Kvadraterat fel för en gruppering L av en mönsteruppsättning X (innehållande
K-kluster).
K-medel klustring
Normalt innehåller en arbetsbeskrivningen rad jobbelement som representerar denna.
Dessa element kan sträckasig från fysiskaförmågor till utbildningsbakgrunder, socialaförmågor, färdighetssätt och
arbetserfarenheter.
Arbetselementenär viktigaför att definiera den verkligabetydelsenav jobbet och hjälpa oss att hitta ochdifferentieraen från
en annan.
Varje arbetselement har under-element med procentuellvikt.
Behöver tillgång till en databas som innehåller information om standardiserade ochyrkesspecifika element (till exempelSSYK
2012)
Vi kan skapa olikatyper av jobbkategorier genomatt jämföra arbetsuppgifter ochjobbelement fråndatabasen. De hämtade
jobben från rekryteringsdatabasenkannu matchas med varandraför att hitta deras likheter.
Vi måste definiera trösklarnaför jobbelementen för var ochen av jobbkategorierna.
Då kan vivetajobbets likhet genom att kontrolleraskillnaden mellan jobbengenom jämförelse av deras arbetselement som
härrör från kategoriernatill arbetstillfällen.
Det skulle behövamycket manuellt arbete för att definiera tröskelvärdenaför allajobbkategorier baserat på de jobbelement
som är riktmärkt från databasen.
Kategorisering efter jobbelement
21. Ett rekommendationssystemsom används av webbplatser på nätet tillämpar dataanalyseteknikernaför att förutsägaoch
rekommenderaprodukter till kunden.
Rekommendationenär att förutse de översta N-liknande produkterna till kunder som tidigare köpt. Den använder
kunden tidigare inköp beteenden, vanor, totalt toppsäljande artiklar eller användarinställningar att rekommendera objekt
till kunden.
Bevisat som en framgångsrik prediktiv modell som rekommendationssystem hittills.
Kan delas upp i två huvudkategorier som minnebaserad samarbetsfiltrering och modellbaserad samarbetsfiltrering.
Minnebaserad samarbetsfiltrering använder statistiska tekniker för att förutsäga och rekommendera jämförelseresultaten
som användare likhet.
Den modellbaserade samarbetsfiltreringen använder sig av det probabilistiska tillvägagångssättet för förutsägelsen
baserat på användarbedömningen på de köpta objekten. Det kan utföras genom kluster, bayesiskt nätverk och
regelbaserade metoder.
Samarbetande filtrering
Ett hybrid-tillvägagångssätt för minnesbaserad och modellbaseradsamarbetsfiltrering.
Det kallas ocksåsom socialfiltrering.
Filtret analyserar innehållet i objektenochskapar kundprofiler som är en riktig representationav användarens intresse när det
gäller sökord, fraser och funktioner.
Föremålen kommer att rekommenderastill användaren baserat på innehållet som matchar deras intressen.
I denna metodbehandlas var ochen av användarna oberoende.
Innehållsbaserad samarbetsfiltrering
22. Jämföraanvändarens köptaobjekt och en rankad post till liknande objekt fråndatabasen ochsammanställer sedan dessa
liknande artiklar i en rekommendationslista.
Matris av liknande objektpar konstrueras genom att beräkna likhetsberäkningen.
Det finns ett antal metoder för att beräkna likheten mellan objekt.
Normalt används Pearson-korrelation eller kosin baserad likhet.
Artikelbaserad samarbetsfiltrering
Denna metod beräknar likheten mellan användarna istället för likheten mellan objekten.
Användarnasom liknar sina preferenser, intressen ochprofiler skulle sammanställas i rekommendationslistan.
I detta fallgrupperas liknande användare som "grannarna" ochdetta beräknas
Enligt deras tidigare betygpå objekten.
Eventuellt obestämt objekt frånanvändarna skulle rekommenderasbaserat på grannskapets tidigare betyg.
Användarbaserad samarbetsfiltrering
Generellt kräver samarbetsfiltrering attanvändarbetyg gör förutsägelsen. Enmodell av
användarbetygmåsteskapasförst för att göra ytterligare manipulationsom länkanalysoch
klustring. Att bygga en modell av användarbetygär tidskrävande och det finns ett uppstartsproblem
där objektet utananvändarbedömning inte kunde rekommenderas.
Dessutom upprätthåller interekryteringswebbplatser användarbetyg,därför är inte
samarbetsfiltreringbra för jobbannonsering.
23. LSA är en högdimensionell linjär associativ modell(Algebraisk modell) som automatiskt lär sig ochanalyserar ett stort korpus
av termer eller ord för att producerasemantisk likhet med termer och meningar.
Latent Semantisk Indexering (LSI) används ofta för att innebära tillämpning av LSA i informationssökning (IS) kontext
som inhämtningsstrategi.
Latent semantisk indexering och den underliggande metoden kallad Singular Value Decomposition (SVD) tillåter oss att
hitta latenta eller semantiska strukturer i meningar
Betydelse eller semantik kan hämtas med den här metoden där en korpus av ord frågas och det kallas konceptsökningar.
Används vanligtvis för att söka efter en uppsättning av dokument.
Dokument som har liknande begrepp baserat på frågekriterierna kommer att returneras även om resultateninte delar
gemensamma villkor.
LSI är härledd och utvecklats från teorin om betydelse.
LSI kan matcha naturligt språk ganska framgångsrikt utankrav på mänskliga ingrepp.
Föreställ dig att samlingar av ord kartläggs i två eller högre dimensionella utrymmen.
Hela relationen representeras av sin plats i det högdimensionella utrymmet.
Detta ger ordet en betydelse med denna beräkningsmodell.
Vissa hävdar att betydelsen härstammar från abstrakta begrepp eller egenskaper i världen före och oberoende av vilken
språkberoende representation som helst.
Därför antas det att datorn inte kan skapa mening från själva data, av det faktum isig själv.
Latent semantisk Index (LSI)
24. LSI är varken fysiska föremål eller mänskliga hjärnor.
Det är bara en kartläggningstekniksom efterliknar vad en hjärna gör.
Dessutom tar LSI-implementering intehänsyntill ordorder i meningarna.
Det reflekterar emellertid som en teori om mening på grund av dess förmåga att förstå, förvärva och
manifestera betydelsen.
Det kan utföra uppgifter som en människa gör med viss grad av framgång.
Därför användsLSI för att differentiera och kategorisera dokumentsom mänskliga experter.
Latent semantisk Index (LSI)
25. Förståelser, förvärvochmanifestationav betydelse är nära besläktade med koncept.
Med andra ord, gruppering eller kartläggning.
För jobbannonsering är en väg att försöka hitta gemensamma begrepp mellan jobben (dokument).
Latent Semantic Indexing (LSI) är kopplad till ett konceptbaserat tillvägagångssätt.
LSI-representativa ord och jobb i ett högdimensionellt utrymme gör det möjligt att relationer mellan termer (ord) och
jobb kan utnyttjas under sökning.
Använder matematiska egenskaper hos en term-jobb matris och bestämmer begreppen genom matrisberäkning.
Konceptbaserat tillvägagångssätt är en mer lämplig metod för matchning av jobb jämfört med konventionell metod.
Detta tillvägagångssätt gör ett mycket bra jobb i matchning av jobb baserat på sammanhang oavsett jobbinnehåll eller
arbetsbeskrivning.
Vi behöver inte förstå varje enskilt ord i arbetsinnehåll för att hitta ett liknande jobb.
Arbetsgivare behöver inte skriva och beskriva sin arbetsposition bara för att det ska bli lätt att hämta. Arbetsgivaren kan
nu beskriva ett jobb med olika ord och olika namn. Det här är några av anledningarna till att ett konceptbaserat
tillvägagångssätt är lämpligt för matchning av jobb.
Konceptet är ett immateriellt och ytterligare lager mellan inmatningsfrågan och det målriktade jobb. Det här extraskiktet
introducerar jobbkontext snarare än jobbinnehåll och det används för att kartlägga en fråga till jobb och vice versa.
Begrepp är inte förutbestämda och fasta. Dessa genereras baserat på de semantiska relationerna mellan dem.
Möjlighet att dra fördelar av latenta relationer bland begrepp när det gäller att hitta relevanta dokument. Jobblikhet kan
identifieras så länge begreppen är fångade.
Konceptbaserad ram
26. Matrisen som genereras genom att inkludera de villkor ochfrekvenssomfinns i dokument eller arbetsbeskrivningar är gles och
dimensioneringsreducering är en vanlig teknik som används för att hantera detta.
Extremt kraftfull teknik, särskilt i en mycket stor och sparsam matris som representerar termerna och meningarna.
Håller viktig information och minskar bullret i data.
Normalt behöver ytterligare dimensioner inte nödvändigtvis ge mer information och de kan införa buller i data.
Dimensionalitetsreduktionsteknik är en väsentlig metod och används även i LSI.
Dimensionalitetsminskning
Matrisnedbrytningeni LSI görs genom ”Singular Value Decomposition” (SVD).
Singular Value Decomposition (SVD) används vanligtvis i bildbehandling, anbefalnings-system, dokumentkluster och
mer.
Transformera korrelerade variabler till en uppsättning okorrelerade sådana som bättre exponerar de olika relationerna
mellan de ursprungliga dataobjekten.
Kan organisera dimensionerna så att datapunkter uppvisar mest variation.
Då är det möjligt att hitta den bästa approximationen av de ursprungliga datapunkterna med färre dimensioner
(datareduktion).
SVD är en dimensioneringsreduktionsteknik som tar en högdimensionell variabel uppsättning av datapunkter och
reducerar den till ett mindre dimensionellt utrymme.
Likhetsmatch med matrisnedbrytning
27. SVS ärdet sammasom ”SingularValue Decomposition (SVD)”på engelska.
Den reducerade representationenuppvisarde viktigaste understrukturerna hosde ursprungligadatapunkterna.
De andravariationernakanignoreras, där, under en visströskel ochdet ärkänt somdatabuller.
Man kanbyggaen term-jobb tabell ochen matrissom hämtas från kolonner i term-jobb tabellen.Därigenom kan manberäknaSVD i matrisen.
Målbilden ärattreduceradimensionernai data gruppen.
Däreftergörvi en likhetsmätningav uppgiften som vi harutförd.
Ut av dettafårvi en likhets värde för frågeställningarna som vi harutförd (korrelationsfaktor) som bestämmervilket resultatsom ärmest likaochdärvid inte relevant
för oss.
Latent semantisk indexering (LSI)
genom Singulär Värde
sönderdelning (SVS)
28. KL är det samma som ”Collective Learning” (CL)” på engelska.
I kognitiv vetenskapfokuserar forskare normalt mer på individuellt lärande än grupper. Människan är själva kollektivt lärande,
men det är för komplicerat att analyseranyckelntill framgång i den kollektivalärandeprocesseniverkligheten. Däremot är
interaktionen mellan djur ganska enkel ochuppvisar kollektivt lärande beteende.
I grunden kommunicerar myror med varandrabaserat på feromonspår. Myrornahittar till exempelden kortaste vägentill mat
källan baserat på den starkaste feromonspåren som lämnades frånde andra myrorna.
En algoritm utveckladesbaserat pådenna idé, nämligen ”Ant Colony Optimization” (ACO).
En annan inspirationskälla där fiskar rör sig under vattnet utan problem. I allmänhet har en partikel informationen om sin
egen position och hastighet, det relativaläget ochde andra partiklarnamed reglerna för uppdatering av position ochhastighet.
I denna betydelse, kanen partikel varaen ersättning av en fisk och ”Particle Swarm Optimization” (PSO) algoritm utvecklades.
Interaktioneni en grupp är nära relaterad till stimulansen ochsvaret ochdetta är framgångsfaktorernaför det kollektiva
lärandet.
I samhällsvetenskapär kollektivt lärande (KL) en social processsomkombinerar tvåeller flera sinnen tillsammans för att lösa
ett problem. Vanligtvishandlar det om kollektivaidéer ochkunskaper som producerasav en grupp människor. Denna grupp av
människor kan varaett samhälle, en organisation eller Internetanvändarna. Kollektivt lärande refererassomen stor frivillig
grupp ochdess samarbete för att lösa ett problem.
Fokuset på kollektivt lärande handlar om intellektuellsynergi som framträder i interaktion mellan individerna. I enklare
termer anses att en grupp fattar bättre beslut än sina enskilda medlemmar igenom att visakollektivt lärande. Detta tar hänsyn
till att ingen av oss kan ha all kunskapensam som en grupp kan som är mer än summan av dess enstaka delar. Komplicerade
problemen kan lösas när en grupp människor från olikabakgrunder och discipliner löser det tillsammans.
Å andra sidan kallas Kollektivt Lärande ocksåför Kollektiv Intelligens(KI).
Kollektivt lärande (KL) eller KI?
29. Kollektivt Lärande kallas oftaför Kollektiv Intelligens(KI).
Kollektiv Intelligenskan utnyttjanätverksteknikenochInternet för att kanalisera många hjärnor hos användarna för att lösa
problem.
KI är "grupp av individer som gör saker kollektivt och som verkar intelligenta".
Crowdsourcing, swarm, wikinomics och smarta mobiltelefoner är några exempel på KI.
KL kan enkelt anpassa sig till kontext och förbättra problemlösningskvaliteten med hjälp av gruppbeslut.
Allt detta är beroende på stimulans som ges till och svaret från grupp.
Kollektiv Intelligens (KI)
30. Matchande algoritm
”Latent Semantisk Indexering” (LSI) är en informationsinhämtningsförfarande
som använder en linjär algebraisk teknik ”Singular Value Decomposition”
(SVD) för att analysera och identifiera semantiska relationer, mönster och
gemensamhet, som hittats i en ostrukturerad korpus av termer.
Normalt betyder den mening som kommer från semantiska relationer från detta
korpus av termer kallar vi sammanhanget eller konceptet eftersom det har
fångat nästan all vital information.
Det är användbart för att öka matchningseffektivitet och effektivitet i form av
matchningsnoggrannhet och bredare arbetsområde. Med den här funktionen är
systemet inte längre begränsat av fråga matchning genom nyckelord, synonym
och polysemi.
Kombinerad med KI och KL, så vil LSI integrerad med SVD ge ett system som
blir lärande i komplexa jobb matchnings utmaningar med mycket ostrukturerad
text som finns i platsannonser.
31. Återkoppling till KL
Om det inte delas någon information mellan arbetssökande, kommer det att
hindra den kollektiva inlärningsprocessen från att lyckas med att lösa komplexa
jobbmatchningsproblem i framtiden.
LSI är en algoritm som försöker imitera mänsklig hjärna för att lösa problem.
En individ har emellertid mycket begränsade resurser för att lösa komplexa
problem.
Däremot kan en grupp arbetssökande vara till hjälp för att fatta beslut som att
lösa komplexa jobbmatchningsproblem istället för en enskild individ.
Användning av en hybrid algoritm som kallas för ”Job Enhanced Latent
Semantisk Indexering” (JELSI) metod som har en med sig en kollektiv
inlärningsmetod (KL) som kommer att öka jobbmatching processen med många
gånger emot en traditionell metod.
32. Vissa jobbansvar och arbetsvillkor är längre,
medan andra är kortare.
Dessa arbetsansvar och arbetsvillkor är sällan
lika långa i jämförelsen av två jobb.
Framtidens jobb vill ha andra jobbansvar och
titlar, något som gör att vi måste ha ett
lärande system för effektiv och träffsäker
jobb matchning för alla kategori jobb och
funktioner
Arbetsmarknaden förändrar sig snabbt – och vi
vill se jobb titlar som vi inte sett förut.
33. Olika jobb titlar som är kommit på senare tid
Citizen Analyst
Media Entrepreneur
Story Architect
Culture Hacker
Editorial manager: ger olika jobb titlarnär vi använder titelsök på www.indeed.com .
Marketing Manager
Social Media Manager
Communications Manager
Product Manager
Project Manager
Public Relations Manager
Marketing Communications Manager
Web Content Manager
Social Media Coordinator
Ny jobb eller bara ny titel eller
arbetsbeskrivning?
Företagsjobbtitel
En revisor kan arbeta för sig själv ellerge tjänster
till individer.I den här rollen kan han helt enkelt ha
titeln som Revisor. Han kan också arbeta för ett
företag där han tar titeln som ekonomichef,
finansdirektöreller bokförare.
Många av dessa företags titlar kan användas i en
rad olika branscher. T.ex. kan chefernas titel betyda
en mängd olika saker och vara i ett antal branscher.
Dessa kan omfatta finans, detaljhandel, sjukvård,
etc.
Kreativbransch jobbtitel
En karriär inom ett kreativt område kan öppna dina
framtidsutsikter för en större mängd olika
arbetsalternativ. De färdigheter som behövs är ofta
sammankopplade och den erfarenhet du får i en
position kan vara användbar i en annan.
Serviceindustrinsbransch jobbtitel
Det finns jobb som är utformadeför att
tillhandahålla en tjänst till allmänheten. De flesta
arbetar med konsumenter och hjälper dem att köpa
saker och njuta av erfarenhetersom de uppskattar.
Andra, som poliser,brandbekämpning och andra
hälso- och säkerhetstjänster,har ett helt annat mål
i åtanke.
34. SSYK 2012 - NYK14 eller Ontologi?
En standard för yrkesklassificering(SSYK 2012), baserad på det internationella SSYK system
börjadeanvändsfrånoch med januari 2014 avStatistiska Centralbyrånoch MIi Sverige.
NYK14NäringslivetsYrkesklassifikation2014 har tagitsfram avSvenskt Näringslivs
medlemsorganisationer baserad på yrkesklassificering SSYK 2012 och startade1 september 2014.
Alternativtillbåda dessa två är användning av Ontologi inom systematiseringavyrkestitlar och
arbetsuppgifter.
Ontologi är den filosofiska studienav karaktärenatt vara, bli, existenseller verklighet, liksom de
grundläggandekategoriernaavvar och deras relationer. Traditionellt listad som en del av filosofins
stora filosofi, som kallas metafysik, behandlar ontologi ofta frågor om vilka enheter som finns eller kan
sägasexistera och hur sådana enheter kan grupperas, relaterasinom en hierarki och indelasefter
likheter och skillnader . Även om ontologi som ett filosofiskt företag är mycket hypotetiskt, har det
också praktisktillämpning inom informationsvetenskapoch teknik, såsom ontologi-teknik.
I informationsteknologi är enontologi arbetsmodellenför enheter och interaktioner inom enviss
domänav kunskap eller praxis, såsom elektroniskhandel eller "planeringensaktivitet". Iartificiell
intelligens(AI) är en ontologi specifikationen avkonceptualiseringar som användsför att hjälpa
program och människor att dela kunskap. I denna användning är en ontologi en uppsättning begrepp
- som saker, händelser och relationer - som specificeraspå något sätt (som specifikt naturligt språk)
för att skapa en överenskommen ordförråd för utbyteav information.
35. Google Jobs API och Ontologi
I hjärtatavCloud Jobs API finns det två proprietäraontologier som kodar för kunskaper om yrken och
färdigheter, liksom relationsmodeller mellandessa ontologier.
A. Yrkes ontologi, en förbättrad utveckling av ”O * NET Standard Occupational Classification”(US
version av SSYK2012),har tre skikt:
1. Det övre skiktet omfattar cirka 30 breda kategorierjobb (t.ex. redovisning och finansiering,
mänskliga resurser, restaurang och gästfrihet).
2. Det andra lagret innehåller 1100 yrkesfamiljer (t ex akutmottagnings sjuksköterskor,
skogsbrukare, databasadministratörer) och ett tredje skikt består av 250 000 specifika yrken (t ex
mjukvaruingenjör, senior mjukvaruingenjör och parkeringstjänsteman).
3. Ett tredje lager består av250 000specifika yrken (t ex mjukvaruingenjör, senior
mjukvaruingenjör ochparkeringsvakt).
B. Kompetensontologin definierar och organiserar cirka50 000 hårda och mjuka färdigheter med
olika typer av relationer som; ”är en”, ”relaterad till” osv.
Relationsmodeller kodar popularitetenoch specificitetenför varjefärdighet för vilken yrkesfamilj och
vilken som helst yrkesverksamhet.
Till exempel är relationsmodellerna som kodar JavaScript, HTML, CSS färdigheterrelateradetill
yrken Front-end engineer, UI-ingenjör etc.
Det gör att Cloud JobsAPI kan identifieraliknandeyrkesfamiljer och specifika yrkenbaserat på
likheten i deraskompetensfördelningar.
37. Google Jobs API och maskininlärning
Storleken på Cloud Jobs API-ontologier gör det opraktiskt att upptäcka relationer med hjälp av explicita
programmeringsmodeller. Användning av maskininlärning spelar en central roll i användningen av dessa
kunskapsrepresentationer, inklusive:
• Upptäck jobbet i arbetssökande frågor och kartlägga dem till noder i yrkesontologin med ett självförtroende.
• Kartläggning av jobbtitlar till noder i yrkesontologin med konfidenspoäng.
• Upptäcka färdigheter i arbetssökande frågor och kartlägga dem till noder i färdighetens ontologi.
• Utdragning av färdigheter i jobbet och kartläggning av dem till noder i färdighetens ontologi.
• Beräkning av relationsmodellerna mellan yrken och färdigheter.
• Innan detta kan hända måste Cloud Jobs API standardisera jobbtitlar.
1. Rensa titlar av vilket språk som inte är direkt relaterat till yrkesdefinitionen.
Detta inkluderar plats, anställningstyp, löneinformation, företagsnamn, reklamjargong (t ex "behövs", "önskat" och "ny
öppning") och administrativ jargong (t ex "referens-ID").
2. Cloud Jobs API beräknar enhögdimensionell vektorisering (cirka 100 000 dimensioner) av de rengjorda
jobbtitlarna. Dimensionerna av vektorrepresentationerna motsvarar termer och uttryck som samlas från titlar och
färdigheter som extraheras från en uppsättning miljontals jobbannonser som hittades på hundratusentals webbplatser.
3. Cloud Jobs API kodar exakt otydlighet på en viss jobbtitel: En ensemble-klassificerare som består av klasser som
klassificerar naturliga språk och flera klasser av neurala nät, försöker kartlägga titeln till noll, en eller flera noder i något
lag av ontologin. Till exempel kartlägger titeln "detaljhandel" till den breda kategorin "Försäljning och detaljhandel",
medan en "golvinstallatörs" arbetsbeteckning omfattar ”linoleum installatör", "golvläggare" och "kakel och marmor
läggare" yrkesfamiljer. Ensemble-klassificeringen erkänner titlar som inte är yrken (dvs det kartlägger dem inte till
ontologin) och ger en konfidenspoäng för vilken som helst kartläggning.
38. Konklusion
Steg 1 blir att uppdatera sättet som rekryteringsdatabaser beräknar och organiserar yrkestitlar, färdigheter,
erfarenheter vid hjälp av ontologi metod och användning av maskininlärning och konstig intelligens (AI). Existerande
modeller som SSYK 2012 och NUK 2014 är redan föråldrade och vill inte stå emot tidens tand och utveckling inom
jobbmarknaden.
Steg 2 blir att använda algoritm(er) som ger möjlighet att använda kollektivt lärande i samarbete med Latent
Semantiskt Indexering.
Steg 3 måsta vara att engagera båda arbetssökande och företagare för att skapa ett Kollektivt Lärande som stödjer
algoritmen i att hitta varandra i arbetsmarknaden.
39. Om mig
Stig-Arnehar erfarenhet som företagsledaremed betydande
företagserfarenhet och bakgrund bådesom geolog och ingenjör.
Dessutom har han stor erfarenhet avatt träna och coacha
yrkesverksamma med behov av att integrera sig på olika områden.
Stig har arbetat som en senior geolog och projektledareför flera olje-
och gasbolag, inklusiveserviceföretag. Stighar haft ansvar för att
förvalta inomhusoch klientbaseradegeovetenskapsprojekt avolika slag,
allt frånintroduktionsnivå, renprospekteringtillutvecklingsfasfrån
börjantill slut. Han har genomgått geologiskautvärderingar och
bidragittillmultidisciplinstudier för möjligheter, prospekt och fält,
inklusive planering och genomförandeavplanering av hela
prospekterings- och reservoar exploateringsprogram.
Han har lång erfarenhet av projektarbetenavolika skala och typer och
van att vara i kontakt med kunder för att svara på frågor som uppstår
under ett projekt.
Stig har fokus på kunskapsbaserade processer och system, kontraktsuppdrag, tillgångsförhandlingar.
Stig-Arnehar haft fokuspå rumslig analysmed fokus på kunskapsbaseradeE& P-processer uppnår
affärsmålmed hjälp av prediktivanalys.
Stig är väl känt för användning avindustriprogramvara inom geovetenskap, kunskapshantering,
affärsanalys, geospatialanalysosv.
Han fungerar som coach för såväl individer som företag, genom att använda olika metoder, inklusive
LSP och LE-system.
40. US Dept. of Labor, McKinsey Consulting, Michigan State University's school of Business
Professor Mike Smith, University of Manchester, Au 1993
John E. Hunter and Ronda F. Hunter , "Validity and Utility of Alternate Predictors of Job Performance", Psychological Bulletin, Vol. 96, N.1, 1984, p.90
Robert P. Tett, Douglas N. Jackson and Michell Rothstein, "Personality Measures as Predictors of Job Performance;
A Meta-Analytical Review", Personal Psychology, Winter 1991, p.703.
Gallup Management Journal; Dr. B Smart, Top Grading. Charles A. Handler, Ph.D. (2009) Using Technology to Support Informed Decision Making Within the Hiring Process; Peter Drucker.
Dunnette, M. D. & Borman, W. C. (1979). Personnel selection and classification systems. Annual Review of Psychology, 30, 477-525.
Hayes, W. L. (1963). Statistics for Psychologists. New York: Holt, Rinehart & Winston, p. 213.
Collaborative Filtering (CF) method (Wikipedia, 2008; Liang et al., 2010; Takács et al., 2009).
Landauer, T.K., 2007. The Traditional Antilearning Argument. In Thomas K. Landauer, D.S.M.S.D.W.K. Handbook of Latent Semantic Analysis. Mahwah, New Jersey, London: Lawrence Erlbaum Associations, Inc. Ch. 1.
pp.5 - 8.
Landauer, T., et al., Learning Human-like Knowledge by Singular Value Decomposition: A Progress Report, M. I. Jordan, M. J. Kearns & S. A. Solla (Eds.), Advances in Neural Information Processing Systems 10,
Cambridge: MIT Press, 1998, pp. 45–51.
Landauer, T.K., Mcnamara, D.S., Dennis, S. & Kintsch, W., 2007. Handbook of Latent Semantic Analysis. New Jersey, London: Lawrence Erlbaum Association, Inc.
Ito, H. & Koshimizu, H., 2004. Keyword and face image retrieval based on latent semantic indexing. In Systems, Man and Cybernetics, 2004 IEEE International Conference on. The Hague, Netherlands, 2004.;
Celebi, E., Sen, B. & Gunel, B., 2009. Turkish — English cross language information retrieval using LSI. In Computer and Information Sciences, 2009, ISCIS 2009. 24th International Symposium on. Guzelyurt, 2009.
Gee, K.R., 2003. Using Latent Semantic Indexing to Filter Spam. In In Proceedings of the 2003 ACM symposium on Applied comput ing. New York, USA, 2003.
Ito, H. & Koshimizu, H., 2004. Keyword and face image retrieval based on latent semantic indexing. In Systems, Man and Cybernetics, 2004 IEEE International Conference on. The Hague, Netherlands, 2004.
Kennedy, J., 2006. Swarm Intelligence. In A.Y. Zomaya, ed. Handbook of Nature-Inspired and Innovative Computing. USA: Springer. pp.187-214.
Doerr, B., Hota, A. & Kötzing, T., 2012. Ants easily solve stochastic shortest path problems. In Soule, T., ed. GECCO '12 Proceedings of the fourteenth in ternational conference on Genetic and evolutionary computation. New
York, 2012. ACM New York.
Abraham, A., Das, S. & Roy, S., 2008. Swarm Intelligence Algorithms for Data Clustering. In In Proceedings of Soft Computing for Knowledge Discovery and Data Mining., 2008.
Backström, T., 2004. Collective learning: A way over the ridge to a new organizational attractor. The Learning Organization, 11(6), pp.466 477.
Klein, M., 2007. Achieving Collective Intelligence via Large-Scale On-line Argumentation. In Internet and Web Applications and Services, 2007. ICIW ‘07. Second International Conference on. Morne, 2007.
Maleewong, K., Anutariya, C. & Wuwongse, V., 2008. A Collective Intelligence Approach to Collaborative Knowledge Creation. In Semantics, Knowledge and Grid, 2008. SKG '08. Fourth International Conferenceon.
Beijing, 2008.
Malone, T.W., 2006. What is collective intelligence and what will we do about it?
Hinchey, M.G., Sterritt, R. & Rouff, C., 2007. Swarms and Swarm Intelligence. Computer, 40(4), pp.111 - 113.
Berg, B.V.d. et al., 2005. Swarm-based Sequencing Recommendations in Elearning. In ISDA '05 Proceedings of the 5th International Conference on Intelligent Systems Design and Applications. Washington, DC, USA, 2005.
Wikipedia – Latens Semantic Analytics, https://en.wikipedia.org/wiki/Latent_semantic_analysis
Matthew Brand (2006). "Fast Low-Rank Modifications of the Thin Singular Value Decomposition" (PDF). Linear Algebra and Its Applications. 415: 20–30.
A parallel implementation of Singular Value Decomposition based on Map-Reduce and PARPACK". Proceedings of 2011 International Conference on Computer Science and Network Technology.
Hu, X., Z. Cai, et al., LSA: First Dimension and Dimensional Weighting, 25th Annual Meeting of the Cognitive Science Society, Boston, MA.
Referenser