Text.Unicode.Normalization

Text.Unicode.Normalization

Description

This module contains functions to do Unicode normalization of CompactStrings.

Synopsis

data NormalizationMode

normalizationToCInt :: NormalizationMode -> CInt

data NormalizationOption = Unicode3_2

normalize :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> CompactString UTF16Native

data NormalizationCheckResult

| NotNormalized

| MaybeNormalized

quickCheck :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> NormalizationCheckResult

isNormalized :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> Bool

concatenate :: CompactString UTF16Native -> CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> CompactString UTF16Native

data ComparisonOption

| CompareCodePointOrder

compare :: CompactString UTF16Native -> CompactString UTF16Native -> [ComparisonOption] -> Ordering

Documentation

data NormalizationMode

A data type for representing an ICU Normalization type. You use this to specify how you'd like ICU to normalize your string.

Constructors

NFD
NFKD
NFC
NFKC
FCD

show/hide

Instances

Eq NormalizationMode

Show NormalizationMode

normalizationToCInt :: NormalizationMode -> CInt

Internal function to convert a NormalizationMode to its C enum value

data NormalizationOption

Options to pass to normalize.

There is only one option ATM.

Constructors

Unicode3_2

Normalize according to Unicode 3.2

show/hide

Instances

Eq NormalizationOption

Show NormalizationOption

BitPackable NormalizationOption

normalize :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> CompactString UTF16Native

Normalizes the given string, according to the given normalization type and options.

This function is a higher-level wrapper around raw_normalize.

Move this to something like Data.CompactString.Normalization, eventually.

Generalize out the UErrorCode handling.

data NormalizationCheckResult

A type for the result of a quick normalization check.

Constructors

Normalized
NotNormalized
MaybeNormalized

show/hide

Instances

Eq NormalizationCheckResult

Show NormalizationCheckResult

quickCheck :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> NormalizationCheckResult

Attempts to check quickly whether a string is already normalized according to a certain normalization mode.

When you get MaybeNormalized as a result, you should normalize the string and compare it to the original to know if it is normalized. You can make ICU do that by calling isNormalized.

isNormalized :: CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> Bool

Tells of a string whether it is already normalized according to a certain mode and options

concatenate :: CompactString UTF16Native -> CompactString UTF16Native -> NormalizationMode -> [NormalizationOption] -> CompactString UTF16Native

Concatenates two normalized strings, such that the result is also normalized.

More formally: Given that string1 is normalized according to mode and options, and string2 is normalized according to mode and options, the result of concatenate string1 string2 mode options will be a concatenation of string1 and string2 and be normalized according to mode and options.

data ComparisonOption

A data type to encode options to the compare function.

Constructors

InputIsFCD	Assume that both strings are FCD normalized
IgnoreCase	Do case-insensitive comparison
CompareCodePointOrder	Compare by code point order (default is code unit order)

show/hide

Instances

Eq ComparisonOption

Show ComparisonOption

BitPackable ComparisonOption

compare :: CompactString UTF16Native -> CompactString UTF16Native -> [ComparisonOption] -> Ordering

Compares two Unicode strings for canonical equivalence.

Two Unicode strings are canonically equivalent when their NFD and NFC normalizations are equal.

Produced by Haddock version 2.4.2