Het UNIX commando sorteren wordt gebruikt om te sorteren op ASCII-tekstbestanden. Het kan worden gebruikt om bestanden van elke grootte te sorteren. De opdracht kan zelfs worden gebruikt om meer dan één bestand sorteren en de uitvoer in een enkel bestand plaatsen. Gegevens kunnen alfabetisch of numeriek worden gesorteerd op elk veld in het bestand.
Gebruik
De sorteeropdracht heeft de syntaxis "soort [opties] bestandsnamen." Zonder opties, de sorteeropdracht maakt gebruik van de gehele lijn als sorteersleutel standaard het bestand gewoon alfabetisch en in oplopende volgorde gesorteerd en wordt afgedrukt van de output naar het scherm. De regels in het bestand hoeft niet te worden van dezelfde grootte. Velden in het bestand worden standaard gescheiden door een spatie.
De commando-opties kunt u het standaardgedrag van de sorteeropdracht. Als u wilt stuur de output naar een bestand in plaats van het scherm, gebruikt u de "-o" optie. Zou de syntaxis "sorteren--o uitgang ingang."
Als u een bestand met numerieke gegevens hebben, moet u de "-n" optie om te vertellen de opdracht om numeriek sorteren. Zou de syntaxis "sort - n bestandsnaam." Natuurlijk kunt u de "-o" optie om de output van de resultaten naar een output-bestand. Dan zou de syntaxis "sort - n -o-uitgang ingang."
Als u zou liever sorteert het bestand in aflopende volgorde (z-a) in plaats van oplopende volgorde (a-z), gebruikt u de "-r" optie. De "r" staat voor reverse in dit geval. Zou de syntaxis "sort - o bestandsnaam."
Sorteren wordt ervan uitgegaan dat de velden zijn gescheiden door spaties, hetgeen betekent dat elk woord op een regel wordt geteld als een veld. Echter, moet u wellicht een bestand met door komma's gescheiden waarden (CSV), of de velden kunnen worden gescheiden door een teken zoals een dubbele punt. Als dit het geval is, gebruikt u de "-t" optie om te wijzen op de field separator. De syntaxis voor een CSV-bestand zou "sort -t, bestandsnaam."
Sorteren wordt ervan uitgegaan dat u wilt gebruiken de gehele lijn als sorteersleutel. Als u alleen sorteren op een specifiek gebied wilt, zou u de optie "+ m" waar "m" is het nummer van het veld min één. Bijvoorbeeld, als je had een CSV-bestand met van het veld Voornaam, laatste naam en adres en je wilde om te sorteren op de achternaam, zou de syntaxis "sort -t, + 1 bestandsnaam." De "+ 1" zegt om te sorteren op het tweede veld. De reden voor de vreemde nummering is vanwege het feit dat Unix-commando's meestal beginnen tellen op "0", niet "1." De opdracht zou vervolgens sorteren op de achternaam en het adresveld als secundaire soort optie te gebruiken.
Als je alleen sorteren op het tweede veld van het bovenstaande voorbeeld wilde, zou je moet vertellen de sorteeropdracht te stoppen met sorteren op het derde veld. Daarvoor gebruikt u de "-m" optie, waarbij "m" het nummer van het veld min één staat. Alleen sorteren op de achternaam in het bovenstaande voorbeeld gebruikt u de syntaxis "sort -t, + 1 -2 bestandsnaam."
Andere veelgebruikte opties omvatten de "-u" en "-d" opties. De "-u" optie vertelt het bevel om af te drukken alleen de unieke waarden na sortering. Als er veelvouden van een enkele regel zijn, wordt slechts één exemplaar van de waarde worden afgedrukt. De "-d" optie zegt voor het uitvoeren van een soort woordenboek van het bestand, wat betekent dat alleen spaties, cijfers en letters in de vergelijking worden gebruikt.
Sorteren kan ook gebruikt worden samen te voegen en twee bestanden in een enkel uitvoerbestand sorteren. Als meer dan één bestandsnaam als een invoerbestand wordt aangeboden, zal de opdracht combineren van de twee bestanden en sorteren van de resultaten. Wanneer gebruikt in combinatie met de "-o" optie, het resultaat zal zijn van een enkel bestand waarin de gesorteerde waarden uit beide bestanden. Zou de syntaxis "sort -o output Ingang1 Ingang2." Andere opties voor de sorteeropdracht kunnen worden gevonden in de belangrijkste sorteerpagina (Zie 'Aanvullende informatie', hieronder.)