U-PRESS

U-PRESS (ゆーぷれす) とは共同通信社が独自に策定した文字コード文字符号化方式および文字セット)。Unicode2.1をベースに基本多言語面 (BMP) の私用領域新聞独特の外字を配置したもので、総収録文字数は15,269文字である[1]

概要

1990年代ワープロパソコンなどの情報機器用に「K-JIS」など新聞社用の独自文字コードが案出されたが、運用の不統一、啓蒙・周知が不十分であったことなどから広く普及はしなかった。そこで共同通信社ではUnicodeを16ビット固定長として(→UTF-16)その外字領域に新聞独自の外字を配置したものを規格化し、2002年より社内運用、2003年からは新聞各社への配信も同文字コードを運用して行っている。

各種文字コードとの対応

  1. JIS X 0201[2]…全文字を収録している。
  2. JIS X 0208[2]…全文字を収録している。ただし字体印刷標準字体に準じる。
  3. JIS X 0212[2]…全文字を収録している。
  4. JIS X 0213[2]…BMPに収録されているものはそのまま収録。それ以外のものは私用領域に収録。
  5. ラテ欄記号や縦書き専用文字、連数字などの独自文字を私用領域に収録している。符号化方式にはUTF-16が使われているため、BMPの範囲内においてはUnicodeと互換性がある。
  6. 上記にないUCSの一部非漢字[2]

U-PRESSは一般的に使われているIBM拡張文字、古い新聞社用文字コードのK-JIS、ラテ欄(特にBSデジタル)に使われているARIB外字などの一部の文字が含まれておらず[3]、イワタはU-PRESSにそれらとの互換性を持たせるめの独自の拡張文字セット(848文字)を規定している[3]

またAdobe-Japan1-6ではU-PRESSの独自文字が追加されているが、例えばモリサワのフォントではU-PRESSとAdobe-Japan1-6との間に字体の違いが存在する[4]

対応システム・フォント

入力用のIMEとしてジャストシステムよりATOKの「for U-PRESS」バージョンが開発・販売されている。

U-PRESS対応フォントには例えば以下が存在する:

  • イワタの各種新聞書体 (イワタ U-PRESS 拡張文字セット対応)[5]
  • モリサワの各種OTF Uprフォント[6]
  • SCREENのヒラギノフォントのUpr版[7]

問題点

JIS X 0213:2004制定前に策定されたあくまで私的な規格であり、サロゲートペア(代用対)に対応していないなどUnicodeとの互換性も不完全であるため、今後、既存コードとの衝突を起こす可能性も危惧される。

関連項目

脚注

  1. ^ 株式会社イワタ 製品情報 - イワタU-PRESS
  2. ^ a b c d e 今さら聞けない文字コードのはなし p.45 イワタ 2019年11月19日
  3. ^ a b 拡張文字セット イワタ U-PRESS Ver.2.1 イワタ
  4. ^ U-PRESS に関して モリサワ
  5. ^ イワタ新聞書体について イワタ
  6. ^ OpenTypeにも種類があるのですか? - よくあるご質問 - サポート モリサワ
  7. ^ ユニバーサルデザインに対応したヒラギノフォントの新書体が販売開始 マイナビ 2012年11月6日
日本語用の
文字コード
JIS規格
符号化文字集合
文字符号化方式
文字一覧
JIS以外の公規格
メーカーの規格
符号化文字集合
文字符号化方式
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
文字符号化方式
文字一覧
TRONコード
日本語以外用の
文字集合
初期の文字コード
ISO/IEC 8859
書誌用
  • ISO 5426
  • ISO 5426-2
  • ISO 5427
  • ISO 5428
  • ISO 6438
  • ISO 6861
  • ISO 6862
  • ISO 9036
  • ISO 10585
  • ISO 10586
  • ISO 10754
  • ISO 11822
  • ANSEL
  • MARC-8
国家標準
EUC
ISO/IEC 2022
  • ISO/IEC 2022 CN
  • ISO/IEC 2022 KR
  • CCCII
MacOS
コードページ
  • Macintosh Standard Roman Character Set
  • アラビア語
  • CentralEurRoman
  • EUC-CN
  • Big5
  • クロアチア語
  • キリル
  • デーヴァナーガリー
  • Dingbats
  • ペルシャ語
  • ギリシア語
  • グジャラート語
  • グルムキー
  • ヘブライ語
  • アイスランド語
  • EUC-KR
  • ルーマニア語
  • MacSymbol
  • TIS-620
  • トルコ語
  • ウクライナ語
DOS
コードページ
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • KOI8
  • Kamenicky
  • Mazovia
  • MIK
  • Iran System
Windows
コードページ
EBCDIC
コードページ
  • 37
  • 293(英語版)
  • 300(英語版)
  • 310(英語版)
  • 351(英語版)
  • 353(英語版)
  • 355(英語版)
  • 357(英語版)
  • 358(英語版)
  • 359(英語版)
  • 360(英語版)
  • 819
  • 930(英語版)
  • 933(英語版)
  • 939(英語版)
  • 1364(英語版)
  • 1390(英語版)
  • 1399(英語版)
  • 8859(英語版)
その他標準
記号用
プラットフォーム
固有
  • ATASCII
  • CDC display code
  • DEC Radix-50
  • Fieldata
  • GSM 03.38
  • HP roman8
  • PETSCII
  • TI calculator character sets
  • ZX Spectrum character set
ソフトウェア
区分け
概念
関連トピック
カテゴリ カテゴリ