emagine söker en konsult med fokus på Observerbarhet till vår kund. Man kommer arbeta nära utvecklare, drifttekniker och andra intressenter för att säkerställa hög tillgänglighet och prestanda i våra nuvarande och framtida lösningar inom observerbarhet.
Start: enligt överenskommelse
Längd: löpande men minst 6 månader
Placering: Stockholm och 1 dag i veckan från kontoret
Exempel på arbetsuppgifter:
Behovsanalys och genomgång av befintliga system: Genomgång av befintliga system och vilket behov dom fyller, går det att konsolidera och använda färre system än idag?
Förslag på övervakningsverktyg: Rekommendation och stöd i implementation av framtida verktyg beroende på behov och systemarkitektur.
Implementera och optimera lösningar för observability i våra system (inklusive loggning, metrics, tracing och alerting)
Identifiera kritiska mätvärden: Definierar och optimerar de nyckelindikatorer som ger relevant insikt i systemets hälsa, till exempel svarstider, serverbelastning, felrater, databaslatens, och användartillfredsställelse
Skapa och underhålla dokumentation för observability-strukturer och processer
Bidra till best practices och ständiga förbättringar av våra arbetsflöden och tekniska lösningar
Delta i incidenthantering och analyser av systemproblem för att föreslå och implementera lösningar
Person vi söker
Har lång erfarenhet av att arbeta med observerbarhet plattformar
Har kunskap inom systemövervakning, logghantering och prestandaoptimering
Har erfarenhet av att arbeta med modern infrastruktur, gärna molnplattformar som AWS, Azure eller Google Cloud
Är van vid att arbeta i DevOps-miljöer och har förståelse för CI/CD-processer
Har goda färdigheter i ett eller flera programmeringsspråk, gärna Python, Go, Java eller Bash
Är analytisk, noggrann och har en problemlösande inställning
Har god kommunikationsförmåga och trivs med att samarbeta med olika team och funktioner
Talar och skriver svenska och engelska obehindrat
Meriterande:
Erfarenhet av containerisering och orkestrering (t.ex. Docker, Kubernetes)
Erfarenhet av infrastrukturen som kod (t.ex. Terraform, Ansible)
Kunskap om ITIL-processer och incidenthantering
Några av systemen vi använder idag: Grafana, Prometheus, Splunk, Icinga, Victoriametrics