CbC/CbC_gcc: gcc/ada/libgnat/a-suenco.adb annotate

annotate gcc/ada/libgnat/a-suenco.adb @ 131:84e7813d76e9

gcc-8.2

author	mir3636
date	Thu, 25 Oct 2018 07:37:49 +0900
parents	04ced10e8804
children	1830386684a0

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 ------------------------------------------------------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	2 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	3 -- GNAT RUN-TIME COMPONENTS --
04ced10e8804 gcc 7 kono parents: diff changeset	4 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	5 -- ADA.STRINGS.UTF_ENCODING.CONVERSIONS --
04ced10e8804 gcc 7 kono parents: diff changeset	6 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	7 -- B o d y --
04ced10e8804 gcc 7 kono parents: diff changeset	8 -- --
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	9 -- Copyright (C) 2010-2018, Free Software Foundation, Inc. --
111 04ced10e8804 gcc 7 kono parents: diff changeset	10 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	11 -- GNAT is free software; you can redistribute it and/or modify it under --
04ced10e8804 gcc 7 kono parents: diff changeset	12 -- terms of the GNU General Public License as published by the Free Soft- --
04ced10e8804 gcc 7 kono parents: diff changeset	13 -- ware Foundation; either version 3, or (at your option) any later ver- --
04ced10e8804 gcc 7 kono parents: diff changeset	14 -- sion. GNAT is distributed in the hope that it will be useful, but WITH- --
04ced10e8804 gcc 7 kono parents: diff changeset	15 -- OUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY --
04ced10e8804 gcc 7 kono parents: diff changeset	16 -- or FITNESS FOR A PARTICULAR PURPOSE. --
04ced10e8804 gcc 7 kono parents: diff changeset	17 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	18 -- As a special exception under Section 7 of GPL version 3, you are granted --
04ced10e8804 gcc 7 kono parents: diff changeset	19 -- additional permissions described in the GCC Runtime Library Exception, --
04ced10e8804 gcc 7 kono parents: diff changeset	20 -- version 3.1, as published by the Free Software Foundation. --
04ced10e8804 gcc 7 kono parents: diff changeset	21 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	22 -- You should have received a copy of the GNU General Public License and --
04ced10e8804 gcc 7 kono parents: diff changeset	23 -- a copy of the GCC Runtime Library Exception along with this program; --
04ced10e8804 gcc 7 kono parents: diff changeset	24 -- see the files COPYING3 and COPYING.RUNTIME respectively. If not, see --
04ced10e8804 gcc 7 kono parents: diff changeset	25 -- <http://www.gnu.org/licenses/>. --
04ced10e8804 gcc 7 kono parents: diff changeset	26 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	27 -- GNAT was originally developed by the GNAT team at New York University. --
04ced10e8804 gcc 7 kono parents: diff changeset	28 -- Extensive contributions were provided by Ada Core Technologies Inc. --
04ced10e8804 gcc 7 kono parents: diff changeset	29 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	30 ------------------------------------------------------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	31
04ced10e8804 gcc 7 kono parents: diff changeset	32 package body Ada.Strings.UTF_Encoding.Conversions is
04ced10e8804 gcc 7 kono parents: diff changeset	33 use Interfaces;
04ced10e8804 gcc 7 kono parents: diff changeset	34
04ced10e8804 gcc 7 kono parents: diff changeset	35 -- Convert from UTF-8/UTF-16BE/LE to UTF-8/UTF-16BE/LE
04ced10e8804 gcc 7 kono parents: diff changeset	36
04ced10e8804 gcc 7 kono parents: diff changeset	37 function Convert
04ced10e8804 gcc 7 kono parents: diff changeset	38 (Item : UTF_String;
04ced10e8804 gcc 7 kono parents: diff changeset	39 Input_Scheme : Encoding_Scheme;
04ced10e8804 gcc 7 kono parents: diff changeset	40 Output_Scheme : Encoding_Scheme;
04ced10e8804 gcc 7 kono parents: diff changeset	41 Output_BOM : Boolean := False) return UTF_String
04ced10e8804 gcc 7 kono parents: diff changeset	42 is
04ced10e8804 gcc 7 kono parents: diff changeset	43 begin
04ced10e8804 gcc 7 kono parents: diff changeset	44 -- Nothing to do if identical schemes, but for UTF_8 we need to
04ced10e8804 gcc 7 kono parents: diff changeset	45 -- handle overlong encodings, so need to do the full conversion.
04ced10e8804 gcc 7 kono parents: diff changeset	46
04ced10e8804 gcc 7 kono parents: diff changeset	47 if Input_Scheme = Output_Scheme
04ced10e8804 gcc 7 kono parents: diff changeset	48 and then Input_Scheme /= UTF_8
04ced10e8804 gcc 7 kono parents: diff changeset	49 then
04ced10e8804 gcc 7 kono parents: diff changeset	50 return Item;
04ced10e8804 gcc 7 kono parents: diff changeset	51
04ced10e8804 gcc 7 kono parents: diff changeset	52 -- For remaining cases, one or other of the operands is UTF-16BE/LE
04ced10e8804 gcc 7 kono parents: diff changeset	53 -- encoded, or we have the UTF-8 to UTF-8 case where we must handle
04ced10e8804 gcc 7 kono parents: diff changeset	54 -- overlong encodings. In all cases, go through UTF-16 intermediate.
04ced10e8804 gcc 7 kono parents: diff changeset	55
04ced10e8804 gcc 7 kono parents: diff changeset	56 else
04ced10e8804 gcc 7 kono parents: diff changeset	57 return Convert (UTF_16_Wide_String'(Convert (Item, Input_Scheme)),
04ced10e8804 gcc 7 kono parents: diff changeset	58 Output_Scheme, Output_BOM);
04ced10e8804 gcc 7 kono parents: diff changeset	59 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	60 end Convert;
04ced10e8804 gcc 7 kono parents: diff changeset	61
04ced10e8804 gcc 7 kono parents: diff changeset	62 -- Convert from UTF-8/UTF-16BE/LE to UTF-16
04ced10e8804 gcc 7 kono parents: diff changeset	63
04ced10e8804 gcc 7 kono parents: diff changeset	64 function Convert
04ced10e8804 gcc 7 kono parents: diff changeset	65 (Item : UTF_String;
04ced10e8804 gcc 7 kono parents: diff changeset	66 Input_Scheme : Encoding_Scheme;
04ced10e8804 gcc 7 kono parents: diff changeset	67 Output_BOM : Boolean := False) return UTF_16_Wide_String
04ced10e8804 gcc 7 kono parents: diff changeset	68 is
04ced10e8804 gcc 7 kono parents: diff changeset	69 begin
04ced10e8804 gcc 7 kono parents: diff changeset	70 if Input_Scheme = UTF_8 then
04ced10e8804 gcc 7 kono parents: diff changeset	71 return Convert (Item, Output_BOM);
04ced10e8804 gcc 7 kono parents: diff changeset	72 else
04ced10e8804 gcc 7 kono parents: diff changeset	73 return To_UTF_16 (Item, Input_Scheme, Output_BOM);
04ced10e8804 gcc 7 kono parents: diff changeset	74 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	75 end Convert;
04ced10e8804 gcc 7 kono parents: diff changeset	76
04ced10e8804 gcc 7 kono parents: diff changeset	77 -- Convert from UTF-8 to UTF-16
04ced10e8804 gcc 7 kono parents: diff changeset	78
04ced10e8804 gcc 7 kono parents: diff changeset	79 function Convert
04ced10e8804 gcc 7 kono parents: diff changeset	80 (Item : UTF_8_String;
04ced10e8804 gcc 7 kono parents: diff changeset	81 Output_BOM : Boolean := False) return UTF_16_Wide_String
04ced10e8804 gcc 7 kono parents: diff changeset	82 is
04ced10e8804 gcc 7 kono parents: diff changeset	83 Result : UTF_16_Wide_String (1 .. Item'Length + 1);
04ced10e8804 gcc 7 kono parents: diff changeset	84 -- Maximum length of result, including possible BOM
04ced10e8804 gcc 7 kono parents: diff changeset	85
04ced10e8804 gcc 7 kono parents: diff changeset	86 Len : Natural := 0;
04ced10e8804 gcc 7 kono parents: diff changeset	87 -- Number of characters stored so far in Result
04ced10e8804 gcc 7 kono parents: diff changeset	88
04ced10e8804 gcc 7 kono parents: diff changeset	89 Iptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	90 -- Next character to process in Item
04ced10e8804 gcc 7 kono parents: diff changeset	91
04ced10e8804 gcc 7 kono parents: diff changeset	92 C : Unsigned_8;
04ced10e8804 gcc 7 kono parents: diff changeset	93 -- Input UTF-8 code
04ced10e8804 gcc 7 kono parents: diff changeset	94
04ced10e8804 gcc 7 kono parents: diff changeset	95 R : Unsigned_16;
04ced10e8804 gcc 7 kono parents: diff changeset	96 -- Output UTF-16 code
04ced10e8804 gcc 7 kono parents: diff changeset	97
04ced10e8804 gcc 7 kono parents: diff changeset	98 procedure Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	99 -- Reads a continuation byte of the form 10xxxxxx, shifts R left by 6
04ced10e8804 gcc 7 kono parents: diff changeset	100 -- bits, and or's in the xxxxxx to the low order 6 bits. On return Ptr
04ced10e8804 gcc 7 kono parents: diff changeset	101 -- is incremented. Raises exception if continuation byte does not exist
04ced10e8804 gcc 7 kono parents: diff changeset	102 -- or is invalid.
04ced10e8804 gcc 7 kono parents: diff changeset	103
04ced10e8804 gcc 7 kono parents: diff changeset	104 ----------------------
04ced10e8804 gcc 7 kono parents: diff changeset	105 -- Get_Continuation --
04ced10e8804 gcc 7 kono parents: diff changeset	106 ----------------------
04ced10e8804 gcc 7 kono parents: diff changeset	107
04ced10e8804 gcc 7 kono parents: diff changeset	108 procedure Get_Continuation is
04ced10e8804 gcc 7 kono parents: diff changeset	109 begin
04ced10e8804 gcc 7 kono parents: diff changeset	110 if Iptr > Item'Last then
04ced10e8804 gcc 7 kono parents: diff changeset	111 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	112
04ced10e8804 gcc 7 kono parents: diff changeset	113 else
04ced10e8804 gcc 7 kono parents: diff changeset	114 C := To_Unsigned_8 (Item (Iptr));
04ced10e8804 gcc 7 kono parents: diff changeset	115 Iptr := Iptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	116
04ced10e8804 gcc 7 kono parents: diff changeset	117 if C < 2#10_000000# or else C > 2#10_111111# then
04ced10e8804 gcc 7 kono parents: diff changeset	118 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	119
04ced10e8804 gcc 7 kono parents: diff changeset	120 else
04ced10e8804 gcc 7 kono parents: diff changeset	121 R :=
04ced10e8804 gcc 7 kono parents: diff changeset	122 Shift_Left (R, 6) or Unsigned_16 (C and 2#00_111111#);
04ced10e8804 gcc 7 kono parents: diff changeset	123 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	124 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	125 end Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	126
04ced10e8804 gcc 7 kono parents: diff changeset	127 -- Start of processing for Convert
04ced10e8804 gcc 7 kono parents: diff changeset	128
04ced10e8804 gcc 7 kono parents: diff changeset	129 begin
04ced10e8804 gcc 7 kono parents: diff changeset	130 -- Output BOM if required
04ced10e8804 gcc 7 kono parents: diff changeset	131
04ced10e8804 gcc 7 kono parents: diff changeset	132 if Output_BOM then
04ced10e8804 gcc 7 kono parents: diff changeset	133 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	134 Result (Len) := BOM_16 (1);
04ced10e8804 gcc 7 kono parents: diff changeset	135 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	136
04ced10e8804 gcc 7 kono parents: diff changeset	137 -- Skip OK BOM
04ced10e8804 gcc 7 kono parents: diff changeset	138
04ced10e8804 gcc 7 kono parents: diff changeset	139 Iptr := Item'First;
04ced10e8804 gcc 7 kono parents: diff changeset	140
04ced10e8804 gcc 7 kono parents: diff changeset	141 if Item'Length >= 3 and then Item (Iptr .. Iptr + 2) = BOM_8 then
04ced10e8804 gcc 7 kono parents: diff changeset	142 Iptr := Iptr + 3;
04ced10e8804 gcc 7 kono parents: diff changeset	143
04ced10e8804 gcc 7 kono parents: diff changeset	144 -- Error if bad BOM
04ced10e8804 gcc 7 kono parents: diff changeset	145
04ced10e8804 gcc 7 kono parents: diff changeset	146 elsif Item'Length >= 2
04ced10e8804 gcc 7 kono parents: diff changeset	147 and then (Item (Iptr .. Iptr + 1) = BOM_16BE
04ced10e8804 gcc 7 kono parents: diff changeset	148 or else
04ced10e8804 gcc 7 kono parents: diff changeset	149 Item (Iptr .. Iptr + 1) = BOM_16LE)
04ced10e8804 gcc 7 kono parents: diff changeset	150 then
04ced10e8804 gcc 7 kono parents: diff changeset	151 Raise_Encoding_Error (Iptr);
04ced10e8804 gcc 7 kono parents: diff changeset	152
04ced10e8804 gcc 7 kono parents: diff changeset	153 -- No BOM present
04ced10e8804 gcc 7 kono parents: diff changeset	154
04ced10e8804 gcc 7 kono parents: diff changeset	155 else
04ced10e8804 gcc 7 kono parents: diff changeset	156 Iptr := Item'First;
04ced10e8804 gcc 7 kono parents: diff changeset	157 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	158
04ced10e8804 gcc 7 kono parents: diff changeset	159 while Iptr <= Item'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	160 C := To_Unsigned_8 (Item (Iptr));
04ced10e8804 gcc 7 kono parents: diff changeset	161 Iptr := Iptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	162
04ced10e8804 gcc 7 kono parents: diff changeset	163 -- Codes in the range 16#00# .. 16#7F#
04ced10e8804 gcc 7 kono parents: diff changeset	164 -- UTF-8: 0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	165 -- UTF-16: 00000000_0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	166
04ced10e8804 gcc 7 kono parents: diff changeset	167 if C <= 16#7F# then
04ced10e8804 gcc 7 kono parents: diff changeset	168 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	169 Result (Len) := Wide_Character'Val (C);
04ced10e8804 gcc 7 kono parents: diff changeset	170
04ced10e8804 gcc 7 kono parents: diff changeset	171 -- No initial code can be of the form 10xxxxxx. Such codes are used
04ced10e8804 gcc 7 kono parents: diff changeset	172 -- only for continuations.
04ced10e8804 gcc 7 kono parents: diff changeset	173
04ced10e8804 gcc 7 kono parents: diff changeset	174 elsif C <= 2#10_111111# then
04ced10e8804 gcc 7 kono parents: diff changeset	175 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	176
04ced10e8804 gcc 7 kono parents: diff changeset	177 -- Codes in the range 16#80# .. 16#7FF#
04ced10e8804 gcc 7 kono parents: diff changeset	178 -- UTF-8: 110yyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	179 -- UTF-16: 00000yyy_xxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	180
04ced10e8804 gcc 7 kono parents: diff changeset	181 elsif C <= 2#110_11111# then
04ced10e8804 gcc 7 kono parents: diff changeset	182 R := Unsigned_16 (C and 2#000_11111#);
04ced10e8804 gcc 7 kono parents: diff changeset	183 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	184 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	185 Result (Len) := Wide_Character'Val (R);
04ced10e8804 gcc 7 kono parents: diff changeset	186
04ced10e8804 gcc 7 kono parents: diff changeset	187 -- Codes in the range 16#800# .. 16#D7FF or 16#DF01# .. 16#FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	188 -- UTF-8: 1110yyyy 10yyyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	189 -- UTF-16: yyyyyyyy_xxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	190
04ced10e8804 gcc 7 kono parents: diff changeset	191 elsif C <= 2#1110_1111# then
04ced10e8804 gcc 7 kono parents: diff changeset	192 R := Unsigned_16 (C and 2#0000_1111#);
04ced10e8804 gcc 7 kono parents: diff changeset	193 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	194 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	195 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	196 Result (Len) := Wide_Character'Val (R);
04ced10e8804 gcc 7 kono parents: diff changeset	197
04ced10e8804 gcc 7 kono parents: diff changeset	198 -- Make sure that we don't have a result in the forbidden range
04ced10e8804 gcc 7 kono parents: diff changeset	199 -- reserved for UTF-16 surrogate characters.
04ced10e8804 gcc 7 kono parents: diff changeset	200
04ced10e8804 gcc 7 kono parents: diff changeset	201 if R in 16#D800# .. 16#DF00# then
04ced10e8804 gcc 7 kono parents: diff changeset	202 Raise_Encoding_Error (Iptr - 3);
04ced10e8804 gcc 7 kono parents: diff changeset	203 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	204
04ced10e8804 gcc 7 kono parents: diff changeset	205 -- Codes in the range 16#10000# .. 16#10FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	206 -- UTF-8: 11110zzz 10zzyyyy 10yyyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	207 -- UTF-16: 110110zz_zzyyyyyy 110111yy_xxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	208 -- Note: zzzz in the output is input zzzzz - 1
04ced10e8804 gcc 7 kono parents: diff changeset	209
04ced10e8804 gcc 7 kono parents: diff changeset	210 elsif C <= 2#11110_111# then
04ced10e8804 gcc 7 kono parents: diff changeset	211 R := Unsigned_16 (C and 2#00000_111#);
04ced10e8804 gcc 7 kono parents: diff changeset	212 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	213
04ced10e8804 gcc 7 kono parents: diff changeset	214 -- R now has zzzzzyyyy
04ced10e8804 gcc 7 kono parents: diff changeset	215
04ced10e8804 gcc 7 kono parents: diff changeset	216 -- At this stage, we check for the case where we have an overlong
04ced10e8804 gcc 7 kono parents: diff changeset	217 -- encoding, and the encoded value in fact lies in the single word
04ced10e8804 gcc 7 kono parents: diff changeset	218 -- range (16#800# .. 16#D7FF or 16#DF01# .. 16#FFFF#). This means
04ced10e8804 gcc 7 kono parents: diff changeset	219 -- that the result fits in a single result word.
04ced10e8804 gcc 7 kono parents: diff changeset	220
04ced10e8804 gcc 7 kono parents: diff changeset	221 if R <= 2#1111# then
04ced10e8804 gcc 7 kono parents: diff changeset	222 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	223 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	224
04ced10e8804 gcc 7 kono parents: diff changeset	225 -- Make sure we are not in the forbidden surrogate range
04ced10e8804 gcc 7 kono parents: diff changeset	226
04ced10e8804 gcc 7 kono parents: diff changeset	227 if R in 16#D800# .. 16#DF00# then
04ced10e8804 gcc 7 kono parents: diff changeset	228 Raise_Encoding_Error (Iptr - 3);
04ced10e8804 gcc 7 kono parents: diff changeset	229 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	230
04ced10e8804 gcc 7 kono parents: diff changeset	231 -- Otherwise output a single UTF-16 value
04ced10e8804 gcc 7 kono parents: diff changeset	232
04ced10e8804 gcc 7 kono parents: diff changeset	233 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	234 Result (Len) := Wide_Character'Val (R);
04ced10e8804 gcc 7 kono parents: diff changeset	235
04ced10e8804 gcc 7 kono parents: diff changeset	236 -- Here for normal case (code value > 16#FFFF and zzzzz non-zero)
04ced10e8804 gcc 7 kono parents: diff changeset	237
04ced10e8804 gcc 7 kono parents: diff changeset	238 else
04ced10e8804 gcc 7 kono parents: diff changeset	239 -- Subtract 1 from input zzzzz value to get output zzzz value
04ced10e8804 gcc 7 kono parents: diff changeset	240
04ced10e8804 gcc 7 kono parents: diff changeset	241 R := R - 2#0000_1_0000#;
04ced10e8804 gcc 7 kono parents: diff changeset	242
04ced10e8804 gcc 7 kono parents: diff changeset	243 -- R now has zzzzyyyy (zzzz minus one for the output)
04ced10e8804 gcc 7 kono parents: diff changeset	244
04ced10e8804 gcc 7 kono parents: diff changeset	245 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	246
04ced10e8804 gcc 7 kono parents: diff changeset	247 -- R now has zzzzyy_yyyyyyxx
04ced10e8804 gcc 7 kono parents: diff changeset	248
04ced10e8804 gcc 7 kono parents: diff changeset	249 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	250 Result (Len) :=
04ced10e8804 gcc 7 kono parents: diff changeset	251 Wide_Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	252 (2#110110_00_0000_0000# or Shift_Right (R, 4));
04ced10e8804 gcc 7 kono parents: diff changeset	253
04ced10e8804 gcc 7 kono parents: diff changeset	254 R := R and 2#1111#;
04ced10e8804 gcc 7 kono parents: diff changeset	255 Get_Continuation;
04ced10e8804 gcc 7 kono parents: diff changeset	256 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	257 Result (Len) :=
04ced10e8804 gcc 7 kono parents: diff changeset	258 Wide_Character'Val (2#110111_00_0000_0000# or R);
04ced10e8804 gcc 7 kono parents: diff changeset	259 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	260
04ced10e8804 gcc 7 kono parents: diff changeset	261 -- Any other code is an error
04ced10e8804 gcc 7 kono parents: diff changeset	262
04ced10e8804 gcc 7 kono parents: diff changeset	263 else
04ced10e8804 gcc 7 kono parents: diff changeset	264 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	265 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	266 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	267
04ced10e8804 gcc 7 kono parents: diff changeset	268 return Result (1 .. Len);
04ced10e8804 gcc 7 kono parents: diff changeset	269 end Convert;
04ced10e8804 gcc 7 kono parents: diff changeset	270
04ced10e8804 gcc 7 kono parents: diff changeset	271 -- Convert from UTF-16 to UTF-8/UTF-16-BE/LE
04ced10e8804 gcc 7 kono parents: diff changeset	272
04ced10e8804 gcc 7 kono parents: diff changeset	273 function Convert
04ced10e8804 gcc 7 kono parents: diff changeset	274 (Item : UTF_16_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	275 Output_Scheme : Encoding_Scheme;
04ced10e8804 gcc 7 kono parents: diff changeset	276 Output_BOM : Boolean := False) return UTF_String
04ced10e8804 gcc 7 kono parents: diff changeset	277 is
04ced10e8804 gcc 7 kono parents: diff changeset	278 begin
04ced10e8804 gcc 7 kono parents: diff changeset	279 if Output_Scheme = UTF_8 then
04ced10e8804 gcc 7 kono parents: diff changeset	280 return Convert (Item, Output_BOM);
04ced10e8804 gcc 7 kono parents: diff changeset	281 else
04ced10e8804 gcc 7 kono parents: diff changeset	282 return From_UTF_16 (Item, Output_Scheme, Output_BOM);
04ced10e8804 gcc 7 kono parents: diff changeset	283 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	284 end Convert;
04ced10e8804 gcc 7 kono parents: diff changeset	285
04ced10e8804 gcc 7 kono parents: diff changeset	286 -- Convert from UTF-16 to UTF-8
04ced10e8804 gcc 7 kono parents: diff changeset	287
04ced10e8804 gcc 7 kono parents: diff changeset	288 function Convert
04ced10e8804 gcc 7 kono parents: diff changeset	289 (Item : UTF_16_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	290 Output_BOM : Boolean := False) return UTF_8_String
04ced10e8804 gcc 7 kono parents: diff changeset	291 is
04ced10e8804 gcc 7 kono parents: diff changeset	292 Result : UTF_8_String (1 .. 3 * Item'Length + 3);
04ced10e8804 gcc 7 kono parents: diff changeset	293 -- Worst case is 3 output codes for each input code + BOM space
04ced10e8804 gcc 7 kono parents: diff changeset	294
04ced10e8804 gcc 7 kono parents: diff changeset	295 Len : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	296 -- Number of result codes stored
04ced10e8804 gcc 7 kono parents: diff changeset	297
04ced10e8804 gcc 7 kono parents: diff changeset	298 Iptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	299 -- Pointer to next input character
04ced10e8804 gcc 7 kono parents: diff changeset	300
04ced10e8804 gcc 7 kono parents: diff changeset	301 C1, C2 : Unsigned_16;
04ced10e8804 gcc 7 kono parents: diff changeset	302
04ced10e8804 gcc 7 kono parents: diff changeset	303 zzzzz : Unsigned_16;
04ced10e8804 gcc 7 kono parents: diff changeset	304 yyyyyyyy : Unsigned_16;
04ced10e8804 gcc 7 kono parents: diff changeset	305 xxxxxxxx : Unsigned_16;
04ced10e8804 gcc 7 kono parents: diff changeset	306 -- Components of double length case
04ced10e8804 gcc 7 kono parents: diff changeset	307
04ced10e8804 gcc 7 kono parents: diff changeset	308 begin
04ced10e8804 gcc 7 kono parents: diff changeset	309 Iptr := Item'First;
04ced10e8804 gcc 7 kono parents: diff changeset	310
04ced10e8804 gcc 7 kono parents: diff changeset	311 -- Skip BOM at start of input
04ced10e8804 gcc 7 kono parents: diff changeset	312
04ced10e8804 gcc 7 kono parents: diff changeset	313 if Item'Length > 0 and then Item (Iptr) = BOM_16 (1) then
04ced10e8804 gcc 7 kono parents: diff changeset	314 Iptr := Iptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	315 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	316
04ced10e8804 gcc 7 kono parents: diff changeset	317 -- Generate output BOM if required
04ced10e8804 gcc 7 kono parents: diff changeset	318
04ced10e8804 gcc 7 kono parents: diff changeset	319 if Output_BOM then
04ced10e8804 gcc 7 kono parents: diff changeset	320 Result (1 .. 3) := BOM_8;
04ced10e8804 gcc 7 kono parents: diff changeset	321 Len := 3;
04ced10e8804 gcc 7 kono parents: diff changeset	322 else
04ced10e8804 gcc 7 kono parents: diff changeset	323 Len := 0;
04ced10e8804 gcc 7 kono parents: diff changeset	324 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	325
04ced10e8804 gcc 7 kono parents: diff changeset	326 -- Loop through input
04ced10e8804 gcc 7 kono parents: diff changeset	327
04ced10e8804 gcc 7 kono parents: diff changeset	328 while Iptr <= Item'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	329 C1 := To_Unsigned_16 (Item (Iptr));
04ced10e8804 gcc 7 kono parents: diff changeset	330 Iptr := Iptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	331
04ced10e8804 gcc 7 kono parents: diff changeset	332 -- Codes in the range 16#0000# - 16#007F#
04ced10e8804 gcc 7 kono parents: diff changeset	333 -- UTF-16: 000000000xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	334 -- UTF-8: 0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	335
04ced10e8804 gcc 7 kono parents: diff changeset	336 if C1 <= 16#007F# then
04ced10e8804 gcc 7 kono parents: diff changeset	337 Result (Len + 1) := Character'Val (C1);
04ced10e8804 gcc 7 kono parents: diff changeset	338 Len := Len + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	339
04ced10e8804 gcc 7 kono parents: diff changeset	340 -- Codes in the range 16#80# - 16#7FF#
04ced10e8804 gcc 7 kono parents: diff changeset	341 -- UTF-16: 00000yyyxxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	342 -- UTF-8: 110yyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	343
04ced10e8804 gcc 7 kono parents: diff changeset	344 elsif C1 <= 16#07FF# then
04ced10e8804 gcc 7 kono parents: diff changeset	345 Result (Len + 1) :=
04ced10e8804 gcc 7 kono parents: diff changeset	346 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	347 (2#110_00000# or Shift_Right (C1, 6));
04ced10e8804 gcc 7 kono parents: diff changeset	348 Result (Len + 2) :=
04ced10e8804 gcc 7 kono parents: diff changeset	349 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	350 (2#10_000000# or (C1 and 2#00_111111#));
04ced10e8804 gcc 7 kono parents: diff changeset	351 Len := Len + 2;
04ced10e8804 gcc 7 kono parents: diff changeset	352
04ced10e8804 gcc 7 kono parents: diff changeset	353 -- Codes in the range 16#800# - 16#D7FF# or 16#E000# - 16#FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	354 -- UTF-16: yyyyyyyyxxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	355 -- UTF-8: 1110yyyy 10yyyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	356
04ced10e8804 gcc 7 kono parents: diff changeset	357 elsif C1 <= 16#D7FF# or else C1 >= 16#E000# then
04ced10e8804 gcc 7 kono parents: diff changeset	358 Result (Len + 1) :=
04ced10e8804 gcc 7 kono parents: diff changeset	359 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	360 (2#1110_0000# or Shift_Right (C1, 12));
04ced10e8804 gcc 7 kono parents: diff changeset	361 Result (Len + 2) :=
04ced10e8804 gcc 7 kono parents: diff changeset	362 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	363 (2#10_000000# or (Shift_Right (C1, 6) and 2#00_111111#));
04ced10e8804 gcc 7 kono parents: diff changeset	364 Result (Len + 3) :=
04ced10e8804 gcc 7 kono parents: diff changeset	365 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	366 (2#10_000000# or (C1 and 2#00_111111#));
04ced10e8804 gcc 7 kono parents: diff changeset	367 Len := Len + 3;
04ced10e8804 gcc 7 kono parents: diff changeset	368
04ced10e8804 gcc 7 kono parents: diff changeset	369 -- Codes in the range 16#10000# - 16#10FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	370 -- UTF-16: 110110zzzzyyyyyy 110111yyxxxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	371 -- UTF-8: 11110zzz 10zzyyyy 10yyyyxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	372 -- Note: zzzzz in the output is input zzzz + 1
04ced10e8804 gcc 7 kono parents: diff changeset	373
04ced10e8804 gcc 7 kono parents: diff changeset	374 elsif C1 <= 2#110110_11_11111111# then
04ced10e8804 gcc 7 kono parents: diff changeset	375 if Iptr > Item'Last then
04ced10e8804 gcc 7 kono parents: diff changeset	376 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	377 else
04ced10e8804 gcc 7 kono parents: diff changeset	378 C2 := To_Unsigned_16 (Item (Iptr));
04ced10e8804 gcc 7 kono parents: diff changeset	379 Iptr := Iptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	380 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	381
04ced10e8804 gcc 7 kono parents: diff changeset	382 if (C2 and 2#111111_00_00000000#) /= 2#110111_00_00000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	383 Raise_Encoding_Error (Iptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	384 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	385
04ced10e8804 gcc 7 kono parents: diff changeset	386 zzzzz := (Shift_Right (C1, 6) and 2#1111#) + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	387 yyyyyyyy := ((Shift_Left (C1, 2) and 2#111111_00#)
04ced10e8804 gcc 7 kono parents: diff changeset	388 or
04ced10e8804 gcc 7 kono parents: diff changeset	389 (Shift_Right (C2, 8) and 2#000000_11#));
04ced10e8804 gcc 7 kono parents: diff changeset	390 xxxxxxxx := C2 and 2#11111111#;
04ced10e8804 gcc 7 kono parents: diff changeset	391
04ced10e8804 gcc 7 kono parents: diff changeset	392 Result (Len + 1) :=
04ced10e8804 gcc 7 kono parents: diff changeset	393 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	394 (2#11110_000# or (Shift_Right (zzzzz, 2)));
04ced10e8804 gcc 7 kono parents: diff changeset	395 Result (Len + 2) :=
04ced10e8804 gcc 7 kono parents: diff changeset	396 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	397 (2#10_000000# or Shift_Left (zzzzz and 2#11#, 4)
04ced10e8804 gcc 7 kono parents: diff changeset	398 or Shift_Right (yyyyyyyy, 4));
04ced10e8804 gcc 7 kono parents: diff changeset	399 Result (Len + 3) :=
04ced10e8804 gcc 7 kono parents: diff changeset	400 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	401 (2#10_000000# or Shift_Left (yyyyyyyy and 2#1111#, 4)
04ced10e8804 gcc 7 kono parents: diff changeset	402 or Shift_Right (xxxxxxxx, 6));
04ced10e8804 gcc 7 kono parents: diff changeset	403 Result (Len + 4) :=
04ced10e8804 gcc 7 kono parents: diff changeset	404 Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	405 (2#10_000000# or (xxxxxxxx and 2#00_111111#));
04ced10e8804 gcc 7 kono parents: diff changeset	406 Len := Len + 4;
04ced10e8804 gcc 7 kono parents: diff changeset	407
04ced10e8804 gcc 7 kono parents: diff changeset	408 -- Error if input in 16#DC00# - 16#DFFF# (2nd surrogate with no 1st)
04ced10e8804 gcc 7 kono parents: diff changeset	409
04ced10e8804 gcc 7 kono parents: diff changeset	410 else
04ced10e8804 gcc 7 kono parents: diff changeset	411 Raise_Encoding_Error (Iptr - 2);
04ced10e8804 gcc 7 kono parents: diff changeset	412 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	413 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	414
04ced10e8804 gcc 7 kono parents: diff changeset	415 return Result (1 .. Len);
04ced10e8804 gcc 7 kono parents: diff changeset	416 end Convert;
04ced10e8804 gcc 7 kono parents: diff changeset	417
04ced10e8804 gcc 7 kono parents: diff changeset	418 end Ada.Strings.UTF_Encoding.Conversions;

Mercurial > hg > CbC > CbC_gcc

annotate gcc/ada/libgnat/a-suenco.adb @ 131:84e7813d76e9