当前位置: 首页 > news >正文

全面探究 LangChain Text Splitters

全面探究 LangChain Text Splitters

  • 0. 引言
  • 1. 文本拆分器的类型
  • 2. 探究各个文本拆分器
    • 2-1. Split by HTML header
    • 2-2. Split by HTML section
    • 2-3. Split by character
    • 2-4. Split code
    • 2-5. MarkdownHeaderTextSplitter
    • 2-6. Recursively split JSON
    • 2-7. Recursively split by character
    • 2-8. Semantic Chunking
    • 2-9. Split by tokens
  • 3. 评估文本拆分器
  • 4. 其他文档转换

0. 引言

加载文档后,您通常需要转换它们以更好地适应您的应用程序。最简单的示例是,您可能希望将长文档拆分为更小的块,以便适合模型的上下文窗口。LangChain有许多内置的文档转换器,可以很容易地拆分、组合、过滤和以其他方式操作文档。

当您想处理长文本时,有必要将该文本拆分为块。尽管这听起来很简单,但这里有很多潜在的复杂性。理想情况下,您希望将语义相关的文本片段放在一起。“语义相关”的含义可能取决于文本的类型。这本笔记本展示了几种方法。

概括地说,文本拆分器的工作方式如下:

  • 将文本拆分为语义上有意义的小块(通常是句子)。
  • 开始将这些小块组合成一个更大的块,直到达到一定大小(由某些函数测量)。
  • 达到该大小后,将该块设为自己的文本片段,然后开始创建一个具有一些重叠的新文本块(以保持块之间的上下文)。

这意味着您可以沿着两个不同的轴自定义文本拆分器:

  • 如何拆分文本
  • 如何测量块大小

1. 文本拆分器的类型

LangChain提供了许多不同类型的文本拆分器。这些都存在于包装中 langchain-text-splitters 。下表列出了所有这些特征,以及一些特征:

  • 名称:文本拆分器的名称

  • 拆分方式:此文本拆分器如何拆分文本

  • 添加元数据:此文本拆分器是否添加有关每个块来源的元数据。

NameSplits OnAdds MetadataDescription
Recursive用户定义字符的列表递归拆分文本。递归拆分文本的目的是尝试使相关文本片段彼此相邻。这是开始拆分文本的推荐方法。
HTMLHTML 特定字符Y根据 HTML 特定字符拆分文本。值得注意的是,这增加了有关该块来自何处的相关信息(基于 HTML)
MarkdownMarkdown 特定字符Y根据 Markdown 特定的字符拆分文本。值得注意的是,这增加了有关该块来自何处的相关信息(基于 Markdown)
Code代码(Python、JS)特定字符根据特定于编码语言的字符拆分文本。有 15 种不同的语言可供选择。
TokenTokens拆分令牌上的文本。有几种不同的方法来衡量 token。
Character用户定义的字符根据用户定义的字符拆分文本。一种更简单的方法。
[Experimental] Semantic Chunker句子首先在句子上拆分。然后,如果它们在语义上足够相似,则将它们合并在一起。摘自Greg Kamradt
AI21 Semantic Text SplitterSemanticsY识别构成连贯文本片段的不同主题,并沿这些主题进行拆分。

2. 探究各个文本拆分器

2-1. Split by HTML header

MarkdownHeaderTextSplitter和HTMLHeaderTextSplitter是一种"结构感知"的分块器,它在元素级别上分割文本,并为每个与给定块"相关"的标题添加元数据。它可以逐个元素返回块,或者组合具有相同元数据的元素,其目标是:(a)保持相关文本在语义上或多或少地分组;(b)保留文档结构中编码的丰富上下文信息。它可以与其他文本分割器一起使用,作为分块管道的一部分。

使用示例 1:使用HTML字符串

示例代码,

from langchain_text_splitters import HTMLHeaderTextSplitterhtml_string = """
<!DOCTYPE html>
<html>
<body><div><h1>Foo</h1><p>Some intro text about Foo.</p><div><h2>Bar main section</h2><p>Some intro text about Bar.</p><h3>Bar subsection 1</h3><p>Some text about the first subtopic of Bar.</p><h3>Bar subsection 2</h3><p>Some text about the second subtopic of Bar.</p></div><div><h2>Baz</h2><p>Some text about Baz</p></div><br><p>Some concluding text about Foo</p></div>
</body>
</html>
"""headers_to_split_on = [("h1", "Header 1"),("h2", "Header 2"),("h3", "Header 3"),
]html_splitter = HTMLHeaderTextSplitter(headers_to_split_on=headers_to_split_on)
html_header_splits = html_splitter.split_text(html_string)
html_header_splits

输出结果,

[Document(page_content='Foo'),Document(page_content='Some intro text about Foo.  \nBar main section Bar subsection 1 Bar subsection 2', metadata={'Header 1': 'Foo'}),Document(page_content='Some intro text about Bar.', metadata={'Header 1': 'Foo', 'Header 2': 'Bar main section'}),Document(page_content='Some text about the first subtopic of Bar.', metadata={'Header 1': 'Foo', 'Header 2': 'Bar main section', 'Header 3': 'Bar subsection 1'}),Document(page_content='Some text about the second subtopic of Bar.', metadata={'Header 1': 'Foo', 'Header 2': 'Bar main section', 'Header 3': 'Bar subsection 2'}),Document(page_content='Baz', metadata={'Header 1': 'Foo'}),Document(page_content='Some text about Baz', metadata={'Header 1': 'Foo', 'Header 2': 'Baz'}),Document(page_content='Some concluding text about Foo', metadata={'Header 1': 'Foo'})]

使用示例 2:通过管道传输到另一个拆分器,从 Web URL 加载 html

示例代码,

from langchain_text_splitters import RecursiveCharacterTextSplitter# url = "https://plato.stanford.edu/entries/goedel/"
url = "https://zh.wikipedia.org/wiki/%E5%8A%89%E5%BE%B7%E8%8F%AF"headers_to_split_on = [("h1", "Header 1"),("h2", "Header 2"),("h3", "Header 3"),("h4", "Header 4"),
]html_splitter = HTMLHeaderTextSplitter(headers_to_split_on=headers_to_split_on)# for local file use html_splitter.split_text_from_file(<path_to_file>)
html_header_splits = html_splitter.split_text_from_url(url)chunk_size = 500
chunk_overlap = 30
text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap
)# Split
splits = text_splitter.split_documents(html_header_splits)
splits[80:85]

输出结果,

[Document(page_content='主条目:劉德華演唱會列表', metadata={'Header 1': '劉德華', 'Header 2': '歌唱事业[编辑]', 'Header 3': '演唱会[编辑]'}),Document(page_content='1991年,刘德华凭借其在电影方面的影响力,在韩国汉城(今首尔)首爾奧林匹克體操競技場举办了一场演唱会,这是他举办的首场个人演唱会。1992年赴美国与加拿大举办的八场个唱为其首次巡回演出[189]。1993年1月,首次於紅磡體育館舉辦了20场的在港個人演唱會[142]。之后1994年与1996年又各举办了20场,1999年、2001年与2004年的夏季各举办15场,2007年、2010年和2018年年底各举办了16场、20场和13场(2018年原定20场,因喉咙发炎被迫取消了7场)的跨年演出[188][198],累计起来目前他已在香港红馆开唱154场。1993年刘德华首次到中国大陆展开了23场的室内巡回演唱会[189],为其首次中国巡演活动。1997年与1998年在内地累计举办20场[189];2000年的中国巡演在济南、沈阳等10个城市展开[189]。2001年与2002年的“夏日Fiesta”巡演合计在武汉、大连、南昌、西安等10个城市举行[189]。2004年至2005年的“Vision', metadata={'Header 1': '劉德華', 'Header 2': '歌唱事业[编辑]', 'Header 3': '演唱会[编辑]'}),Document(page_content='Tour”中国巡回在上海、苏州、西安、无锡等19个城市上演[189]。2007年的“Wonderful World”中国巡回从呼和浩特开始到成都结束共在15个城市举办[193],其中上海站一连举办了两场;2009年继续进行了广州、合肥等9个城市的“Wonderful World”中国巡回个唱[192]。2011年在北京、郑州和天津等11站举办“Unforgettable”中国巡回演出[199]。2013年开启的“ALways”中国巡回个唱选择在上海、南京、广州、北京和大连这五座城市的体育馆举行[232],以达到同香港红馆四面台一样的室内效果。至今刘德华已在中国大陆各城市举办了132场个人演唱会,其中上海为其举办场次最多的内地城市。由于创下过许多城市的票房上座和現場火暴記錄,刘德华也被一些中国媒体和演出商誉为“華語歌壇票房第一人”[233][234][235][236]。', metadata={'Header 1': '劉德華', 'Header 2': '歌唱事业[编辑]', 'Header 3': '演唱会[编辑]'}),Document(page_content='除了香港和中国大陆,刘德华也多次到台湾、新加坡、马来西亚,以及北美的温哥华和多伦多等华人聚集的城市举办演唱会[189]。从1991年到2013年之间除了2006年和2012年外,刘德华每年都举办了多场演唱会,其中1996年以累计举办47场为其演唱会最多的一年[189]。其演唱会顺序大多都是先在香港举办连续多场的个唱,然后再到各地巡演,不过2007年与2013年这两年却以中国巡演为开端,然后才赴其他地区举办。在演出内容上,香港本土以粤语歌曲为主,各地巡演则以国语歌曲为主,而《一起走过的日子》和《忘情水》[129]这两首经典代表作是其演唱频率最多的歌曲。刘德华在每次巡演前都会学习一些新的舞蹈以表演给歌迷[237],如2001年的拉丁舞[170]与2004年的踢踏舞[238]。其演出现场经常以劲歌热舞为开端,中间会安插一些表演和歌唱同时进行的以爱情为主题的音乐剧[239][237][240],而且从头到尾刘德华与歌迷、观众交流互动的机会比较多[158]。由于多年来刘德华陆续演绎了许多首广为流行和传唱的经典歌曲,因此《谢谢你的爱》、《忘情水》、《天意》、《中国人》、《笨小孩》、《冰雨》、《爱', metadata={'Header 1': '劉德華', 'Header 2': '歌唱事业[编辑]', 'Header 3': '演唱会[编辑]'}),Document(page_content='《忘情水》、《天意》、《中国人》、《笨小孩》、《冰雨》、《爱你一万年》、《练习》等名曲在个唱上常常会引起集体大合唱[129]。从1994年至今,刘德华已发行11张个唱影碟,其中在香港红馆录制的有1994、1996、1999、2001、2004、2007和2010年共七张,2002年的《你是我的骄傲演唱会》于12月6日在香港伊利沙伯体育馆举办,是为庆祝他入行20年而专门为三千名华仔天地会员举办的一次免费演出[241]。另外三张冠名为中国巡回演唱会的影碟,分别是在2004年的北京工人体育场、2007年和2011年的上海体育场录制的,这开创了歌手在北京和上海这两大能容纳6万名以上观众的体育场发行演唱会影碟的先河,其中北京演唱会不仅入选中国演出家协会评选的「2004中国十大演出盛事」,而且还是2004年中国单场演出票房最高的一场演出[242]。', metadata={'Header 1': '劉德華', 'Header 2': '歌唱事业[编辑]', 'Header 3': '演唱会[编辑]'})]

限制
不同的 HTML 文档之间可能存在相当大的结构差异,虽然 HTMLHeaderTextSplitter 会尝试将所有"相关"的标题附加到任何给定的文本块上,但有时可能会遗漏某些标题。例如,该算法假设信息层次结构中的标题总是位于与文本相关联的"上方"节点,即前面的兄弟节点、祖先节点以及它们的组合。在以下新闻文章中(截至本文撰写时),文档的结构使得顶级标题的文本虽然被标记为 “h1”,但它所在的子树与我们期望它"在上方"的文本元素是不同的——因此我们可以观察到 “h1” 元素及其相关文本没有出现在文本块元数据中(但在适用的情况下,我们确实看到了 “h2” 及其相关文本)。

示例代码,

# url = "https://www.cnn.com/2023/09/25/weather/el-nino-winter-us-climate/index.html"
url = "https://zh.wikipedia.org/wiki/%E5%8A%89%E5%BE%B7%E8%8F%AF"headers_to_split_on = [("h1", "Header 1"),("h2", "Header 2"),
]html_splitter = HTMLHeaderTextSplitter(headers_to_split_on=headers_to_split_on)
html_header_splits = html_splitter.split_text_from_url(url)
print(html_header_splits[1].page_content[:500])

输出结果,

No two El Niño winters are the same, but many have temperature and precipitation trends in common.  
Average conditions during an El Niño winter across the continental US.  
One of the major reasons is the position of the jet stream, which often shifts south during an El Niño winter. This shift typically brings wetter and cooler weather to the South while the North becomes drier and warmer, according to NOAA.  
Because the jet stream is essentially a river of air that storms flow through, the

2-2. Split by HTML section

与 HTMLHeaderTextSplitter 概念相似,HTMLSectionSplitter 是一种"结构感知"的分块器,可以在元素级别分割文本,并为与任何给定块"相关"的每个标题添加元数据。它可以逐个元素返回块,或组合具有相同元数据的元素,目的是 (a) 在语义上或多或少地保持相关文本分组,(b) 保留文档结构中编码的上下文丰富信息。它可以与其他文本分割器一起用作分块管道的一部分。在内部,当节的大小大于块大小时,它使用 RecursiveCharacterTextSplitter。它还考虑文本的字体大小,以根据确定的字体大小阈值确定它是否是一个节。使用 xslt_path 提供绝对路径来转换 HTML,以便它可以根据提供的标签检测节。默认是使用 data_connection/document_transformers 目录中的 converting_to_header.xslt 文件。这是为了将 html 转换为更容易检测节的格式/布局。例如,可以根据字体大小将 span 转换为标题标签,以检测为一个节。

from langchain_text_splitters import HTMLSectionSplitter

20240407 时点 langchain_text_splitters 包中还没有 HTMLSectionSplitter,无法进行实际学习,暂且保留

2-3. Split by character

这是最简单的方法。它根据字符(默认为"")进行拆分,并通过字符数来衡量块的长度。

  • 文本如何拆分:按单个字符拆分。
  • 块大小如何衡量:按字符数衡量。

示例代码,

# This is a long document we can split up.
with open("./files/liudehua.txt") as f:liudehua = f.read()
from langchain_text_splitters import CharacterTextSplittertext_splitter = CharacterTextSplitter(separator="\n\n",chunk_size=1000,chunk_overlap=200,length_function=len,is_separator_regex=False,
)
texts = text_splitter.create_documents([liudehua])
# print(texts[0])
print(f"{texts=}")

输出结果示例,

texts=[Document(page_content='刘德华,BBS,MH,JP(英语:Andy Lau Tak Wah;1961年9月27日—),香港男演员、歌手、填词人、监制及出品人,1990年代获封为香港乐坛“四大天王”之一[3],也是吉尼斯世界纪录大全中获奖最多的香港歌手[4];在影视方面,他三次获得香港电影金像奖最佳男主角奖,两次获得金马奖最佳男主角奖,至今参演电影超过170部[5]。刘德华是天幕公司和映艺集团的创建者,作为投资人与监制已参与制作了30多部华语电影[6]。除此之外,刘德华是四川省川剧学校客座教授[7]。\n\n1999年,刘德华获得“香港十大杰出青年”的荣誉,2000年11月则顺利荣登“世界十大杰出青年”[8],成为获此殊荣的少数几位香港艺人。2006年7月7日,香港演艺学院因他“是香港最受尊重和喜爱的演艺名人之一,对香港电影及音乐贡献良多。其严谨专业的工作态度,足以成为年轻人的典范”,为了“表彰他在表演艺术方面的成就”而授予刘德华荣誉院士称号[9],他也因此成为少数几位获此荣誉的香港艺人之一[10]。\n\n刘德华笃信佛教,法号“慧果”,热心公益,时常参与慈善活动。2008年,刘德华获香港特别行政区政府委任为太平绅士[11],2010年4月23日,刘德华获任中国残疾人福利基金会理事并担任副理事长[12]。2010年5月2日,刘德华获颁第十二届“世界杰出华人奖”同时获颁授加拿大纽奔驰域蓝仕桥大学荣誉博士学位[13]。2013年12月8日,他又当选香港残疾人奥委会暨伤残人士体育协会副会长[14]。2017年12月他因演艺事业和公益事务上的成就被香港树仁大学授予荣誉文学博士学位。2018年6月受邀加入美国电影艺术与科学学会成为会员[15]。\n\n\n刘德华出生于香港新界大埔泰亨村(旧称菜坑村[注 1])[16],籍贯广东新会县荷塘镇(今江门市)[17]。祖父在当时算是大地主(乡村、农地)[18]。另外,他在家中亦有三姊、一妹和一弟(刘德盛)[19][20][21],自己在家中排行第四[22]。其父刘礼年轻时为启德机场的消防员[16]。'), Document(page_content='刘德华出生于香港新界大埔泰亨村(旧称菜坑村[注 1])[16],籍贯广东新会县荷塘镇(今江门市)[17]。祖父在当时算是大地主(乡村、农地)[18]。另外,他在家中亦有三姊、一妹和一弟(刘德盛)[19][20][21],自己在家中排行第四[22]。其父刘礼年轻时为启德机场的消防员[16]。\n\n刘德华五岁多时由于任职驻守机场消防员的父亲希望他能入读英文小学而随家人离开了农村[注 1],全家后来搬到了九龙钻石山大磡村(曾就读村里的大磡村街坊福利会小学)[23]。钻石山为贫民区,多是木屋,容易发生火灾。刘家的木屋在刘德华十一岁时被大火烧毁,家人因此住在寮屋一年[18],家人后来再搬到蓝田邨第十五座。[24]在刘德华五、六岁时,父亲还开了一间名叫“得胜士多”的小吃杂货店以赚钱维持家用[注 1];刘德华与姐姐们则经常担任店里的帮工一起干活,当时负责写菜名的他为日后写下一手好的毛笔字奠定了基础[25]。离店不远处有一家“坚城片场”,往片场送外卖的他也能常见到曹达华、石坚、冯宝宝等当红演员拍戏时的模样[26]。因为父亲嗜吃叉烧,后来刘德华更把蓝田邨十五座地下的“华东烧腊”买下来送予父亲,现时他和父母都住在加多利山大宅[27],而其大姐一家则住在大围新翠邨公屋。[28]\n\n刘德华,出生时取名“德华”,在就学阶段曾取学名为“福荣”,刘福荣只是学名而非本名,“刘德华”就是本名[29],他本人在《鲁豫有约》、《康熙来了》中曾亲口公开澄清此事。[30][31] 刘德华在黄大仙天主教小学毕业后[32][注 1],升读位于新蒲岗的英文中学可立中学[33]。升读可立之后,刘德华于就读中一级时曾因英文科成绩差而留级一年[注 1],经补习后继续升班[注 1]。与校内要好的同学走在一起,还自号“可立七侠”[25],同时,他参加校外中小学跳弹床公开比赛[注 2]。亦热心参加校内外学校剧社的表演[注 2],参与幕后制作负责编剧[注 2],而教授他有关戏剧方面知识的地理科老师,就是后来的著名舞台剧编剧杜国威[33][注 2]。刘德华在中五会考获得1B3D2E(中文读本A)的成绩,中六上学期后,到香港电视广播有限公司(TVB)的艺员训练班受训[34]。此前他在中学阶段开始到慈云山踢足球[注 2],与黄日华识于微时[注 2];当时刘担任守门员[注 2],黄担任前线球员[注 2]。'), Document(page_content='1980年刘德华为了想当导演而入读第10期无线电视艺员训练班[35][36][注 3],著名的同期同学有吴家丽、梁家辉、戚美珍、张之亮、徐锦江等,1981年毕业后任无线电视台演员[34]。在香港电台电视部制作的电视单元剧《香港香港8:江湖再见》里首次演出[37]。其后在李添胜监制的时装警匪电视剧《猎鹰》里首度担演男主角饰演一名投身警界的青年警察而开始走红[35]。\n\n1983年受TVB力捧,与黄日华、梁朝伟、苗侨伟和汤镇业组成“无线五虎将”[35],相继出演了1983年萧笙监制、与陈玉莲合作的50集武侠剧《神雕侠侣》,1984年李添胜监制、与梁朝伟合作的《鹿鼎记》等多部很受欢迎的无线剧集,其中在片中饰演杨过的《神雕侠侣》不仅是刘德华最为重要的电视剧代表作[38],其人气甚至让他成为电影投资方,导演等重用的新晋,奠定他往影坛发展基础。1999年该剧为刘德华赢得TVB无线千禧“我最难忘的男主角”荣誉,而且还被金庸先生于2003年选为他最满意的根据其小说改编成的两部电视剧之一(另外一部是1976年郑少秋主演《书剑恩仇录》)[39]。\n\n刘德华于1982年开始参演电影,首部作品是吴小云执导的《彩云曲》[35],其中刘的戏份比较少。第一部参演的重要电影作品是1982年许鞍华执导的表现越南战后普通人生活和移民香港题材的《投奔怒海》[37],获得第二届香港电影金像奖最佳新演员提名,不过败于以同一电影提名的女演员马斯晨[40]。1983年霍耀良执导的《毁灭号地车》是刘德华首部担纲男主角的电影。\n\n1985年吴思远执导、刘德华与叶德娴主演的法庭剧情片《法外情》是刘德华早期主演电影中的一部重要代表作[41]。刘在片中扮演一位年轻的律师在法庭上唇枪舌战的表现不俗,而法庭外与身世有关的感情戏则比较赚人眼泪。《法外情》的成功促使主创们后来又拍摄了两部续集《法内情》和《法内情大结局》[42]。另外,这时期刘跟洪金宝等人合作的群星动作片《最佳福星》,以及与周润发合作的江湖片《江湖情》都获取了良好的票房成绩。'), Document(page_content='1988年至1992年是刘德华拍片量最多的时期,这五年他参演了超过50部作品。其中演出最多最成功的类型是黑社会江湖片,并塑造了多个成长于草根、身在江湖却有情有义英雄未泯、却以悲剧收场的“情深烂仔”、“良心古惑仔”与“悲剧英雄”角色,深深影响当时的年轻人[43][44]。1988年他与张曼玉和张学友合作王家卫的导演处女作《旺角卡门》,塑造了一个重情重义的江湖混混华仔形象,使其首次获得香港电影金像奖最佳男主角提名[45],该片也为刘赢得首座表演奖杯——台湾金龙表演艺术奖最佳演员奖[35];1989年由向华胜、王晶联合执导,刘与谭咏麟合作的黑帮赌片《至尊无上》票房达2300多万港币,是为数不多的讲述兄弟情义的港产赌片。1990年他与吴倩莲在陈木胜的导演处女作《天若有情》中,演绎了小混混华Dee与千金小姐JOJO之间一段刻骨铭心的浪漫生死恋,感动了华语地区及韩国等地许多观众[46],本片的成功也导致后来他与吴倩莲在杜琪峰执导的1991年作品《至尊无上II之永霸天下》和1996年作品《天若有情III之烽火佳人》中合演情侣[47]。该时期他主演的其他主要古惑仔电影还有《同根生》、《飚城》、《狱中龙》等。\n\n而刘德华亦凭借其出众的偶像外型拍摄了大量的商业片,其中与著名导演王晶合作的次数最多,双方合作最具代表性的作品有以《最佳损友》系列、《精装追女仔II》、《与龙共舞》为代表的爱情喜剧片,刘德华在其中表现了喜剧表演才能,票房成绩也不俗;他与王晶合作的另一类主要电影是赌博片,如1989年与周润发合作的《赌神》,1990年与周星驰合作的《赌神》续集《赌侠》,都成为当时非常卖座的商业类型片[43][48],这些作品使得刘德华的“赌侠”与周润发的“赌神”和周星驰的“赌圣”并列为港产赌片的三大代表角色[48]。90年代后期刘与王晶又合作了两部以King哥为主角的续集《赌侠1999》和《赌侠大战拉斯维加斯》,分别于1998年与1999年上映。[48]'), Document(page_content='此外,该时期比较知名的作品还有《九一神雕侠侣》和《五亿探长雷洛传》。1991年的《九一神雕侠侣》是刘德华成立的天幕制作有限公司拍摄的首部作品,是他与梅艳芳等人合作的一部现代奇幻浪漫动作片,收获了良好的反响和票房[49]。同年分为两部先后上映的《五亿探长雷洛传》由刘国昌执导,是一部改编自真人故事的传记片,刻画了一个香港警察雷洛在腐败横行的法治乱世中成长为巨贪枭雄的兴衰成败史[45],两部累计票房5300万,刘德华也凭借雷洛一角获得第11届香港电影金像奖最佳男主角提名[45]。《雷洛传》的成功使刘德华又接拍了表现澳门赌王传记题材的《赌城大亨》系列,也分成两部于1992年先后上映,获得不错反响[43][48]。不过,高产时期的刘德华也往往被认为“处理性格和情感没有深度,角色类型化”,影评人张伟雄说:“他喜欢在镜头里玩形态,玩火机,玩枪,玩小动作,连发型都不能改。可以说,他是同一时期一直演两种角色而已,路数甚窄。多产期还造就了刘德华在表演上的另一个大特点,就是模仿。”[43]'), Document(page_content='罗马拼音\tLau Tak Wah\n英文名\tAndy Lau\n昵称\t华仔、华哥、刘天王\n别名\t刘福荣\n国籍\t 中华人民共和国(香港)\n出生\t1961年9月27日(62岁)\n 英属香港新界大埔泰亨乡(菜坑村)[1]\n职业\t演员、歌手、电影制片、填词人、出品人\n语言\t粤语、英语、国语\n教育程度\t可立中学中六预科肄业\n无线电视艺员训练班\n四川省川剧学校注册学习[2]\n配偶\t朱丽倩(2008年结婚)\n儿女\t1女\n音乐类型\t华语流行、粤语流行\n演奏乐器\t人声、二胡、口琴\n出道地点\t 英属香港\n出道日期\t1981年,\u200b41年前\n出道作品\t《香港香港:江湖再见》(电视剧)\n《彩云曲》(电影)\n《只知道此刻爱你》(专辑)\n代表作品\n音乐作品歌曲创作影视作品\n活跃年代\t1981年至今\n唱片公司\t华星唱片(1985年)\n百代唱片(1987年至1989年)\n宝艺星(1990年至1992年)\n华纳唱片(1992年至1995年)\n博德曼音乐(1996年至2001年)\n百代唱片(2002年至2004年)\n东亚唱片(2005年至2016年)\n映艺音乐(2017年至今)\n经纪公司\t无线电视(1981年至1986年)\n艺能机构(1986年至1992年)\nICM(美国经纪公司)(1992年至1990年代末)\n中国星集团(1990年代至2003年)\n天中娱乐(2001年至2002年)\n加际娱乐(2002年至2005年)\n映艺娱乐(2005年至今)\n\n尽管香港电影业自1990年代中期已进入了产量锐减和票房下降的衰退阶段,不过刘德华的电影事业却一直在进步,佳作不断。[43]\n\n1993年刘镇伟执导的《天长地久》是天幕公司拍摄的一部浪漫剧情片,刘德华与刘锦玲和吴家丽合作诠释了一段演艺圈里的悲剧爱情故事,其缠绵悱恻的味道成为刘德华电影生涯为数不多的一部文艺片。[50]1994年刘德华投资的《天与地》在内地取景拍摄,讲述民国时期禁毒专员张一鹏到上海打击毒枭的故事,结局设计使得本片充满了悲剧色彩和批判意味。[51]'), Document(page_content='1993年刘镇伟执导的《天长地久》是天幕公司拍摄的一部浪漫剧情片,刘德华与刘锦玲和吴家丽合作诠释了一段演艺圈里的悲剧爱情故事,其缠绵悱恻的味道成为刘德华电影生涯为数不多的一部文艺片。[50]1994年刘德华投资的《天与地》在内地取景拍摄,讲述民国时期禁毒专员张一鹏到上海打击毒枭的故事,结局设计使得本片充满了悲剧色彩和批判意味。[51]\n\n1995年与梁咏琪合作主演尔冬升执导的赛车励志片《烈火战车》,片中其对阿祖叛逆、倔强和执著的心理刻画和多重情感纠葛的演绎让刘德华获得了第三次金像奖最佳男主角提名[45]。同年主演林岭东导演的《大冒险家》在菲律宾、香港和美国三地拍摄,它在大型枪战爆炸场面上的制作上比较精良[52]。90年代后期由于刘德华的天幕公司已累计亏损4000万,刘德华于是向向华强夫妇求助,并连续跟向氏的永盛公司和中国星集团合作,拍摄了《新上海滩》、《天地雄心》、《龙在江湖》、《赌侠1999》、《黑马王子》、《赌侠大战拉斯维加斯》等许多卖座商业片,这些作品都进入了香港年度票房前十。[53]其中在1996年潘文杰执导的《新上海滩》中演绎了一个从低层奋斗慢慢崛起最终遇害的黑帮大哥丁力新形象[54]。1998年与梁咏琪主演黑帮电影《龙在江湖》,其饰演的黑帮成员韦吉祥悲剧结局颠覆了导演王晶一贯的欢乐风格。这一时期已进入中年阶段的刘德华在《烈火战车》、《龙在江湖》和《赌侠1999》等片中的演绎突破了他以往塑造的年轻黑帮英雄形象,成为“反英雄”角色的代表[43]。'), Document(page_content='从1999年杜琪峰执导的《暗战》开始,刘德华摆脱了过去比较偶像化的演绎方法[55],不断深入角色性格与内心成功实现转型,塑造了许多不同身份与个性的角色[43],如《暗战》里身患绝症、与谈判专家斗智斗勇、为父报仇、亦正亦邪的华[55],《孤男寡女》中的销售部门经理华少,《阿虎》中悲情的拳击手孟虎,《瘦身男女》里贪吃又坚持自我牺牲的肥佬,《无间道》和《终极无间》中在警局里任高级督察的黑帮卧底刘健明,以及《大只佬》中经过多重考验后终于看透因果真谛的了因和尚等。这一连串作品不仅在票房和口碑上赢得佳绩[43],亦获第19届到23届连续五届的香港电影金像奖最佳男主角提名[45],其中凭借《暗战》和《大只佬》两度得奖[56],并入围第38届、40届和41届金马奖最佳男主角,以《无间道III》获奖[35]。此外,《阿虎》为他赢得第六届香港电影金紫荆奖最佳男主角奖[57],《大只佬》赢得第十届香港电影评论学会大奖最佳男演员[58]和第四届华语电影传媒大奖最佳男主角奖[59],《孤男寡女》、《瘦身男女》和《大只佬》为刘赢得三次演艺动力大奖最突出电影男演员称号。而《孤男寡女》、《瘦身男女》和《无间道》的大卖不仅巩固了刘德华的票房巨星地位[43],亦使得他与郑秀文成为当时很受欢迎的一对银幕情侣,而杜琪峰与刘德华和郑秀文三人也有了“铁三角”之称。[60]因此1999年至2004年是刘德华港产片时代的一段颠峰时期。\n\n2005年在陈德森执导的奇幻悲剧电影《童梦奇缘》中,刘克服挑战借化妆技术呈现了巨大年龄跨度的演出,他的表现不仅成为该片的最大看点,其光仔一角又获金像奖最佳男主角提名[61]。2006年参演尔冬升执导的毒品题材的警匪片《门徒》,在片中他将一位复杂个性之毒枭刻画得逼真到位,并以此片赢得一座金像奖男配角奖[62]。2007年,刘德华因其自1997年以来对香港电影的贡献而与著名监制江志强一同获得香港电台主办、香港电影金像奖协办的香港特区十周年电影选举杰出成就奖[63]。'), Document(page_content='合拍片时代\n随着2003年以来香港与内地的电影合作不断加深,刘德华也经常在合拍片中担任主角。2004年,先与中国著名导演张艺谋合作武侠片《十面埋伏》,该片获得了良好的国际票房与西方的好评[64];接着又与著名商业导演冯小刚合作犯罪剧情片《天下无贼》,被陈可辛称赞道成功演绎了一位颇有说服力的大陆人形象[43],获得第五届华语电影传媒大奖最佳男主角提名[65]以及香港电影金紫荆奖最佳男主角提名。2005年香港电影评论学会副会长登徒认为“刘德华应该算第一个在内地发展得很好的香港明星,他能找到与国内电影工作者合作的方法。”[43]\n\n2006年主演了香港文艺导演张之亮执导的中日韩合拍古装战争片《墨攻》,其饰演的主张“兼爱非攻”的墨家使者革离一角获得2007年亚洲电影大奖最佳男演员提名[66]以及香港电影金紫荆奖最佳男主角提名。2007年刘德华与李连杰、金城武合作陈可辛执导的古装战争巨制《投名状》,以片中粗犷直性、命运悲惨的草莽兄弟赵二虎一角获得第十次香港金像奖最佳男主角提名[67]。2008年在李仁港导演的古装动作片《三国之见龙卸甲》中展现了青年与老年两个阶段、胸怀壮志且表现勇猛的三国英雄人物赵子龙,成为刘德华本人比较满意的一个银幕角色。2010年在徐克武侠回归之作《狄仁杰之通天帝国》中,刘德华塑造了一个有勇有谋的大唐神探狄仁杰新形象,作为主演亦参与角逐第67届威尼斯国际电影节最佳男演员奖项[68],该片也获得了“目前最接近好莱坞标准的华语类型片”的史诗娱乐巨制的赞誉[69]。\n\n2011年刘德华投资并与叶德娴合作主演许鞍华执导的剧情片《桃姐》,在这部根据真人真事改编而成的老人题材的作品中了他饰演了一位很有生活质感的普通人,极具说服力的内敛演出让他先后在第48届金马奖和第31届香港电影金像奖上称帝[70][71][72]。2012年10月他被金马奖执委会委任为第49届金马奖评审团主席[73]。2013年又受邀担任第七届亚洲电影大奖评审团主席[74]。'), Document(page_content='2011年刘德华投资并与叶德娴合作主演许鞍华执导的剧情片《桃姐》,在这部根据真人真事改编而成的老人题材的作品中了他饰演了一位很有生活质感的普通人,极具说服力的内敛演出让他先后在第48届金马奖和第31届香港电影金像奖上称帝[70][71][72]。2012年10月他被金马奖执委会委任为第49届金马奖评审团主席[73]。2013年又受邀担任第七届亚洲电影大奖评审团主席[74]。\n\n时隔多年之后,他再次与杜琪峰和郑秀文合作,在2013年推理喜剧片《盲探》中首次演绎了一位盲人侦探角色庄士敦,该片为他赢得2013年西班牙锡切斯电影节最佳男主角奖,是刘德华赢得的首个国际影展影帝殊荣[75]。值得一提的是,《盲探》是他自2005年以来所主演的唯一一部纯港产片。同年12月上映的《风暴》由刘德华与江志强联合投资并监制[6],为袁锦麟编导、刘与林家栋主演的一部港产警匪片,他坚持亲自完成大量高难度动作戏[76],其火爆场面被认为可媲美同类型好莱坞电影,而刘演绎的警官吕明哲集人性冲突和善恶于一身,被一些影评人认为是一个突破[77][78][79]。\n\n2015年刘德华在华谊兄弟出品、改编自真人真事、中国女编剧兼作家彭三源编导的电影处女作《失孤》中演绎一名坚持寻子十多年的中国底层农民雷泽宽[80],他的表演成为该片最大的看点,其颠覆性的演出获得普遍肯定[81][82][83],获得第30届金鸡奖最佳男主角提名和第35届香港电影金像奖最佳男主角提名[84][85],赢得第16届华表奖优秀男演员奖[86]。9月上映丁晟编导的中国警匪片《解救吾先生》也同样取材自真实事件,他饰演一名被劫匪绑架后冷静求生的香港影星吾先生,获得第2届丝绸之路国际电影节最佳男演员奖[87]。同年参演张艺谋执导的中美合拍3D魔幻动作巨制《长城》,2016年12月在中国上映。[88]'), Document(page_content='2017年刘德华监制并主演邱礼涛编导的大制作港产警匪片《拆弹专家》,演绎了一位不畏悍匪、忠于职责、敢于牺牲的英雄警察,获得第37届香港电影金像奖最佳男主角提名,赢得首届最港电影大奖最港男演员奖[89]。同年与甄子丹合作在王晶导演的《追龙》中特别演出、继1991年的《五亿探长雷洛传》后再次演绎雷洛一角。2019年继续与邱礼涛合作,监制并与古天乐、苗侨伟和林嘉欣合作主演港产动作片《扫毒2天地对决》,饰演一位从黑道背景成功转型、痛恨毒贩并与昔日兄弟决裂的金融巨子余顺天,中国大陆获取13.12亿人民币成为港产片大陆市场票房冠军[90]。\n\n由关信辉执导、刘德华投资监制于2017年完成拍摄的香港青春励志电影《热血合唱团》在2020年11月公映,刘演绎一位帮助“问题学生”成长进步的音乐指挥老师严Sir。刘德华、刘青云和倪妮主演的《拆弹专家》续集《拆弹专家2》继续由邱礼涛执导、刘德华监制,同年12月上映后票房与口碑都获取佳绩,其演绎的人物性格前后反差巨大的潘乘风一角获得普遍赞誉。刘德华与肖央、万茜合作的黑色幽默剧情片《人潮汹涌》在2021年春节上映,由饶晓志编导、刘德华监制,他演绎了一个因意外失忆而成为努力上进的龙套演员的假杀手周全。\n\n刘德华与吴京、李雪健合作的郭帆执导的科幻巨制《流浪地球2》在2023年春节上映,他演绎了一位不懈追求数字生命的电脑工程师图恒宇,电影获取了很好的口碑与票房。'), Document(page_content='刘德华与吴京、李雪健合作的郭帆执导的科幻巨制《流浪地球2》在2023年春节上映,他演绎了一位不懈追求数字生命的电脑工程师图恒宇,电影获取了很好的口碑与票房。\n\n票房与合作\n电影票房方面,由于刘德华是香港一线影星中拍片数量最多的男演员(1988年到1992年共计达50多部),因此在2005年由香港UA院线主办的“光影梦魅20年暨全港最高票房电影颁奖典礼1985-2005”上[91],他以108部累计约17.3亿港币票房获全港最高票房男演员奖。在2007年由香港国际电影节主办的首届亚洲电影大奖上,刘德华获亚洲电影票房巨星大奖[92]。至今其主演(第一或第二主演)的作品中香港票房超过2000万港元的共有28部,其中有15部超过2500万,分别为《赌神》、《赌侠》、《五亿探长雷洛传》、《整蛊专家》、《烈火战车》、《孤男寡女》、《瘦身男女》、《全职杀手》、《无间道》、《大只佬》、《无间道3》、《门徒 (电影)》、《投名状》、《桃姐》和《拆弹专家》。共有45部刘德华主演的电影进入香港华语片年度票房前十,是票房前十次数最多的香港演员。中国大陆票房超过一亿人民币作品有20部,分别为《十面埋伏》、《天下无贼》、《投名状》、《游龙戏凤》、《狄仁杰之通天帝国》、《新少林寺》、《天机:富春山居图》、《盲探》、《风暴》、《失孤》、《解救吾先生》、《赌城风云III》、《王牌逗王牌》、《拆弹专家》、《侠盗联盟》、《追龙》、《扫毒2天地对决》、《拆弹专家2》、《人潮汹涌》和《流浪地球2》。他主演的作品香港和大陆票房最高的分别为《无间道》(5500万港币)和《流浪地球2》(40.3亿人民币)。'), Document(page_content='在合作对象方面,迄今合作次数最多的导演是多达20多部的王晶;而合作11次的杜琪峰则是与刘德华合作最成功的一位导演,刘德华有多部代表作均出自杜琪峰之手,包括让刘两度金像奖称帝的《暗战》和《大只佬》[93],他同杜琪峰亦是现实中关系较好的朋友。男演员方面,与其关系最好的男艺人有苗侨伟[94][95][96]、黄日华、林家栋等人[97][98]。跟刘德华合作过的女演员有很多,其中合作最多次的是从1988年的《群龙夺宝》开始到1999年拍摄的《卫斯理蓝血人》为止共11次的关之琳,双方因此也在90年代被媒体称作“银幕情侣”[47],2011年1月在他举办的香港演唱会上关之琳作为嘉宾时,刘德华更笑称“我当年真的以为会和她结婚”[99];在90年代,刘德华与吴倩莲演过四次情侣让人印象深刻[47];2000年代以来,与刘德华合作次数最多最默契的为郑秀文,两人从2000年的《孤男寡女》到2013年的《盲探》共七部电影中饰演情侣[47]。此外不得不提的一位女艺人是叶德娴,由于叶德娴与刘德华在其成名电视剧《猎鹰》和《法外情》系列中演绎了感人的母子对手戏,叶德娴因而成为刘德华的干妈并保持着亲密的私人关系[100][101],在2010年刘德华香港跨年个唱上叶德娴还以常驻嘉宾的身份参与了每场演出[102],这对母子搭档在相隔多年之后再次在2011年许鞍华作品《桃姐》中又有精彩感人的合作,并为叶德娴连续赢得威尼斯电影节、德班国际电影节、金马奖、亚洲电影大奖、香港金像奖等九个影后殊荣。'), Document(page_content='为了实现个人的电影梦想,刘德华于1991年成立了属于自己的天幕制作有限公司。首部作品《九一神雕侠侣》由刘德华与梅艳芳主演于1991年12月上映,收获了良好的口碑和2000多万港币票房,该片让天幕公司一举成功[49]。不过之后的《吴三桂与陈园园》、《九二神雕侠侣》、《战神传说》、《天长地久》、《天与地》、《1/2次同床》几部电影票房都不如预期,累计亏损达4000万以上港币,几乎令天幕公司濒临破产,1990年代后期刘德华靠借债、接拍电影、出唱片、开演唱会、做广告代言的收入拿来投资电影才维持住了公司的营运[103]。1997年投资陈果导演的小成本独立电影《香港制造》赢尽口碑[104][105],并获得香港电影金像奖最佳电影、最佳导演[106]以及金马奖最佳导演、最佳编剧等多个大奖[107],之后又合作了《去年烟花特别多》[108],这两部作品是天幕公司仅有的纯文艺片,但是票房也很差。《阿虎》与《爱君如梦》是天幕公司最后的两部作品,都由刘德华主演,前者成为他的演技代表作[45][57],后者是部讲述小人物追求梦想的歌舞喜剧片[109]。'), Document(page_content='2002年刘德华与合伙人麦绍棠发生法律纠纷[110][111],导致刘德华重新成立了一家新公司映艺娱乐有限公司。刘德华吸取了天幕公司的教训,不再拍摄大制作商业片,主要投资小成本的文艺片[112]。2005年余伟国执导的《再说一次我爱你》为映艺首部作品,是刘德华与杨采妮、蔡卓妍合作的一部爱情悲剧电影[113]。2005年启动的“亚洲新星导计划”是专门为扶持新导演的一个电影项目,共资助了大华语地区的六名年轻导演拍摄了六部作品,其中包括台湾的《人鱼朵朵》、中国大陆的《疯狂的石头》、新加坡的《爱情故事》、马来西亚的《太阳雨》,以及香港的两部作品《师奶唔易做》与《得闲饮茶》[114]。这些小成本作品口碑大多不错,而其中影响最大最成功的是宁浩导演的《疯狂的石头》[115],这部黑色喜剧片在内地获得了2300多万的票房[116],也收获了大量的好评和多个奖项[117],并让宁浩导演与郭涛、黄渤、刘桦等演员开始成名并走红[118],后来宁浩于2009年推出的又一部黑色喜剧片《疯狂的赛车》在大陆票房过亿[119]。刘德华对扶持新导演所做的贡献,让他于2006年获得第11届釜山国际电影节颁发的亚洲最有贡献电影人大奖[120],2007年又获得第七届华语电影传媒大奖年度杰出电影人称号。[121]\n\n2007年赵崇基执导的警匪片《兄弟》仿效《五虎将之决裂》以无线五虎演员间的友情为出发点,撮合了苗侨伟、刘德华、黄日华、汤镇业四人另加陈奕迅等人参与演出[122]。2010年郭子健与郑思杰联合编导的《打擂台》是一部向香港电影黄金时代致敬的作品,由一众老艺人泰迪罗宾、梁小龙和陈观泰主演,赢得第三十届香港电影金像奖最佳电影等四个奖项[123]。2011年许鞍华执导的《桃姐》改编自真人故事,刘德华与叶德娴演出了一段朴实感人的主仆情,并呈现出老年人的生存状态,该片收获了广泛的赞誉和许多奖杯的肯定。2013年刘德华投资并监制的校园青春片《初恋未满》是刘娟导演的处女作,获得第16届上海国际电影节“亚洲新人奖”单元评委会特别奖[124]。2013年12月公映的作品《风暴》是由映艺与安乐公司联合投资的一部大制作商业片,为香港首部3D警匪片。[125]2015年客串并参与投资台湾校园青春爱情片《我的少女时代》,该片获取好口碑的同时也在台湾、香港、中国大陆以及新加坡、马来西亚和韩国等地区创造票房佳绩。'), Document(page_content='2015年刘德华与马来西亚成功集团的陈永钦拿督合作成立了一家电影制作公司——梦造者娱乐。该公司在2017年推出邱礼涛执导的《拆弹专家》得到第37届香港电影金像奖最佳电影、最佳导演等七项提名。同年国庆档的《追龙》获得香港金像奖最佳电影等六项提名。2019年暑期档的《扫毒2之天地对决》在中国大陆获取13.12亿人民币票房,创造港产片大陆票房记录。2020年圣诞档上映的《拆弹专家2》在中国大陆获取13.14亿人民币,超越《扫毒2》成为新的港产片大陆市场冠军。\n\n\n歌唱事业\n初入歌坛(1985年-1989年)\n刘德华在与林子祥合演《投奔怒海》期间,有天片场收工后林子祥招呼大家一起唱卡拉OK,林子祥听了刘德华的歌后很是欣赏,于是大加赞赏并鼓励刘德华去唱歌,于是在林子祥的鼓励下刘德华开始发展自己的歌艺[126],因此林子祥可以算是刘德华歌唱事业的伯乐。\n\n1985年刘德华进军乐坛,在香港华纳唱片有意签他为旗下歌手及无线电视高层建议下加盟华星唱片[注 4],推出了第一张专辑《只知道此刻爱你》[127],共包括《只知道此刻爱你》等计13首粤语歌曲,其稚嫩的唱腔未获得很大回响,但与张学友、邝美云一起入围最佳新人奖。1986年转入百代唱片后至1989年这四年间,相继推出了《情感的禁区》、《回到你身边》、《回到你身边&法内情》、《刘德华》、《爱的连线》、《共你伤心过》共计六张唱片[127],其中1987年发行的《情感的禁区》中的同名主打歌《情感的禁区》成为其第一首成功流行的歌曲,1989年《回到你身边&法内情》是其首张国语唱片,1988年《回到你身边》中的《永远记得你》、1989年《刘德华》中翻唱自英文摇滚歌曲的《我恨我痴心》以及1989年《共你伤心过》中的《流浪》这几首粤语歌数年后经常为刘德华所演唱而让歌迷所熟悉。整体上来讲,85至89年这段时期是刘德华在歌坛的探索期,音乐成绩不仅平平,其在歌唱技巧方面与成功歌手也有比较大的差距,演员出身的他在歌坛的发展前景当时并不为外界所看好。[128]'), Document(page_content='全盛期(1990年-2006年)\n1990年在进入宝艺星唱片后,刘德华迎来了歌唱事业的春天[129]。5月发行的《可不可以》销量达三白金,同名主打歌《可不可以》为其赢得香港电台颁发的十大中文金曲奖,是其获得的第一个重要歌曲奖项[130]。同年推出的国语专辑《如果你是我的传说》热卖四白金,主打歌《如果你是我的传说》开始流行于台湾、中国大陆和东南亚等地,刘德华因此获得台湾《民生报》主办的金曲龙虎榜最受欢迎歌手称号,也被认为是成功打入国语歌市场的第一位香港歌手[131]。12月推出另一张粤语专辑《再会了》的同名主打歌赢得90年度TVB颁发的十大劲歌金曲奖,最后更是勇夺十大劲歌金曲最受欢迎男歌星奖[132],让刘德华成为继谭咏麟和张国荣后,又一位获此大奖的男歌手。[133]\n\n1991年6月推出《爱不完》专辑[127],在港年度销量超过四白金(20万张)。9月另一张热卖专辑《一起走过的日子》销量超越四白金(20万张),是91年三张销量最高的专辑之一(另两张为张学友的《一颗不变心》及黎明的《是爱、是缘》)。而《爱不完》及《一起走过的日子》更同时入选宝丽金于1999年推出的《20世纪最强中文大碟》20强(备注:从五十张历年宝系唱片公司最高销量的唱片当中,再经乐迷、音乐人及传媒等….票选出二十张最强大碟)[134]。1992年12月于华纳唱片发行的粤语专辑《真我的风采》达至八白金唱片(即40万张)的销量。1991年和1992年刘德华以大热姿态继续包揽十大劲歌金曲最受欢迎男歌星奖,奠定了其在香港乐坛的偶像地位。在1992年的偶像热潮下,刘德华与张学友、黎明、郭富城被传媒封为“四大天王”[135]。\n\n另一方面,刘德华继续巩固其国语影响力,1991年至1992年相继推出了三张国语大碟《我和我追逐的梦》、《来生缘》和《谢谢你的爱》[127],这些唱片与同名主打歌继续在台湾和中国大陆等地保持热销和流行地位,《来生缘》台湾销量达十白金,刘德华于1992年当选北京电视台最受欢迎歌星奖以及台湾《民生报》主办的“台湾十大偶像选举”第一名,此后刘德华在歌坛事业的红火让其连续五届蝉联这一荣誉(该选举一共举办了1992到1997年六届)[136][137]。1992年刘德华到美国与加拿大举办了八场个人演唱会,成为其首次巡演活动。'), Document(page_content='刘德华于1992年加入飞碟唱片后,相继推出《真情难收》、《答案就是你》、《一生一次》、《爱意》、《忘情水》、《五时三十分》和《天意》这多张唱片[127]。其中《答案就是你》和《五时三十分》成为他的经典粤语唱片,前者包括《答案就是你》、《暗里着迷》、《你是我的梦》、《这一生是给你一个》、《开心的马骝》和《永远寂寞》多首经典歌曲,《永远寂寞》获得93年度十大中文金曲奖[130];后者则有《花花世界》、《口琴别恋》、《谁人知》和《钻石眼泪》这四首主要作品,《谁人知》成为94年度十大劲歌金曲[138]和十大中文金曲双料金曲[130]。1994年发行《忘情水》和《天意》是刘德华的经典国语唱片[136],《忘情水》获得了包括94年度十大劲歌金曲最受欢迎国语歌曲金奖[138]、十大中文金曲奖和优秀国语歌曲金奖,以及华语榜中榜金曲奖在内的许多歌曲大奖,《忘情水》在亚洲销量超过300万张成为当年的大卖作品,也是刘德华本人销量最高的一张唱片[139]。《忘情水》和《天意》在台湾的销量也位列前矛[136]。此外,《一生一次》中的《不能没有你》赢得93年度十大中文金曲奖优秀国语歌曲[130],《爱意》中的《情人Happy Birthday》获得93年度十大劲歌金曲[140]。刘德华又以大热态势拿下1993年度十大劲歌金曲国内最受欢迎香港男歌星和1994年度十大劲歌金曲最受欢迎男歌星奖[138],93年在红磡体育馆举办的20场“真我的风采”演唱会为其第一次香港个唱[141],93年首次在中国大陆的上海[142]、北京[141]、重庆等地展开了23场的室内巡回演唱会[137][143]。1994年再次在香港红馆举办了一连20场的演唱会。此时大红的刘德华受邀参加95年中国中央电视台春节联欢晚会演唱了名曲《忘情水》[144],扩大了自己在中国大陆的知名度和影响力。[128]'), Document(page_content='1995年8月的国语专辑《真永远》是刘德华当年加盟艺能动音后的首张作品,同名主打歌《真永远》获得95年度十大中文金曲和全球华人至尊金曲奖[130],而《爱火烧不尽》是其主演电影《大冒险家》的片尾曲,励志歌曲《今天》后来也广为流传。1995年12月的粤语专辑《情未鸟》中的《情未鸟》成为95年度十大劲歌金曲[145]和十大中文金曲双料金曲[130],另一首代表作《情深的一句》为其主演电影《烈火战车》的主题曲。1996年相继发行了《相思成灾》和《因为爱》两张国语唱片[127],歌曲《相思成灾》获得96年度十大中文金曲奖优秀国语歌曲银奖[130]和新城金心国语歌钻石奖,歌曲《因为爱》获得96年度十大劲歌金曲奖最受欢迎国语歌曲铜奖[146]以及华语榜中榜金曲奖[147]。1996年的粤语唱片《在乎您》主要有《倒转地球》、《一个人睡》和《潮水》三首名曲,前者是刘德华96年在红馆举办的20场演唱会的主题歌,《一个人睡》获得十大劲歌金曲奖[140],《潮水》是较受刘个人喜爱的个人作词作品。此外刘德华于1996年亦录制了歌唱生涯首张且唯一一首日文歌曲《再一次拥抱》(日语:もう一度抱きしめたい),并于日本发行同名EP,于台湾及香港发行同名单曲专辑[148][149]。\n\n1997年的国语专辑《爱如此神奇》主要收集了多首翻唱自其他歌手的经典歌曲,新曲主要有《爱如此神奇》和《中国人》,《爱如此神奇》入选第四届华语榜中榜20大金曲[150],《中国人》是为迎接香港回归、歌颂中华民族的爱国主义歌曲,专辑名列97年度金曲龙虎榜国语大碟专辑第5名[140]。《中国人》后来成为刘德华参加中国大陆晚会和香港回归纪念活动时经常演唱的一首名曲[151][152][153]。1997年12月发行了《真生命》和《爱在刻骨铭心时》两张专辑[127],粤语歌《真生命》成为97年度十大劲歌金曲,国语唱片《爱在刻骨铭心时》则因包括《孤星泪》、《冰雨》、《偷回忆的人》和《世界第一等》四首经典作品而成为其经典唱片,《孤星泪》和《冰雨》后来成为传唱度很高的经典情歌[154][155],《世界第一等》由伍佰创作[156],是刘德华演唱的唯一一首台语歌[157][158]。《爱在刻骨铭心时》成为金曲龙虎榜1998年国语十大专辑之一[140]。'), Document(page_content='1998年发行粤语专辑《你是我的女人》与国语专辑《笨小孩精选》两张唱片[127],前者唱片里包括主打歌《你是我的女人》、《他的女人》等多首刘德华个人填词作品,刘与美国萨克斯大师肯尼·基合作的《你是我的女人》[159]成为98年度十大劲歌金曲和十大中文金曲双料金曲[130],以及98年醉心龙虎榜十大金曲第2位和新城电台年度劲爆歌曲。《笨小孩精选》主要收录历年许多经典国语歌曲,包括《忘情水》、《天意》、《一生一次》和《真情难收》在内的四首歌被新编重唱成另一种味道[160],而新歌《笨小孩》由刘德华与柯受良、吴宗宪合唱[161],是刘德华根据个人经历创作的一首励志歌曲[160],赢得98年度十大劲歌金曲奖最受欢迎国语歌金奖、十大中文金曲奖优秀国语歌曲金奖[130]、劲爆国语歌曲等多个大奖。\n\n1999年上半年推出的国语专辑《人间爱》收录了多首与内地音乐人合作的歌曲,如高枫3首,丁蕾1首,李泉1首,由于融入大量内地流行音乐元素,因此成为一张风格新颖、大陆味道浓重的专辑。其中讲述人生哲理的《木鱼与金鱼》获得99年度十大中文金曲优秀国语歌曲金奖[130],《男朋友》为其主演电影《黑马王子》的主题曲,另外《都怪我》、《会说话的哑巴》和《回家真好》都有一定的流行度;下半年推出粤语专辑《爱无知》获得Music Tower 全年唱片大奖,《爱无知》与《痛》为其中代表作。当年八月他以金发造型在红馆举办一连15场的演唱会[162],主题曲是刘德华为“西藏慈善音乐会”献唱的单曲《爱你一万年》[143],这首大气的抒情歌曲入选99年度十大劲歌金曲最受欢迎国语歌曲金奖和全球华语音乐榜中榜20大金曲,也为刘德华赢得华语音乐榜中榜“跨世纪男歌手”称号[163]。99演唱会影碟的普及使之后来成为歌迷的最爱,为其最经典的一次个唱演出。'), Document(page_content='2000年8月发行国语唱片《男人的爱》由上海音乐才子李泉、香港制作人陈德建、台湾流行音乐强手刘天健及徐德昌等多位顶尖音乐人参与创作,这些制作人分别从不同角度探讨男人的爱[164],主打歌《男人哭吧不是罪》由刘本人填词并唱出了一股很浑厚的男人心声,获得2000年度十大中文金曲奖[130],刘与陈慧琳合唱的《我不够爱你》获得2000年度十大劲歌金曲最受欢迎国语歌曲金奖和中文金曲奖优秀国语歌曲奖金奖[130],以上两首也同时入选全球华语音乐榜中榜20大金曲,刘德华更是赢得华语榜中榜“最受欢迎歌手大奖”称号。此外,《享用我的姓》、《没有你的城市》和《爱情新活力》质量也不俗,令《男人的爱》成为其唱片代表作。12月推出的粤语专辑《心蓝》[165],因包括《心蓝》、《当我遇上你》、《微笑》和《缺陷美》四首主要歌曲成为其粤语唱片代表作,《心蓝》获得香港乐坛评议会最受欢迎年度流行金曲金奖,作为其主演电影《阿虎》主题曲的《当我遇上你》成为2000年度十大劲歌金曲[166],《微笑》为《阿虎》的电影插曲,《缺陷美》为TVB电视《美丽人生》主题曲。\n\n2001年6月发行国语唱片《天开了》,主打歌《我的心只可容纳你》是刘德华为其代言的道地绿茶创作的广告歌,作曲人赵增熹借由弦乐来表现山水的绵延与人类的深情[167],获得01年度十大劲歌金曲最受欢迎国语歌曲铜奖[166]和十大中文金曲奖优秀国语歌曲奖铜奖[130],并入选全球华语音乐榜中榜20大金曲,《踢出个未来》是刘德华为周星驰电影《少林足球》创作的主题曲,获香港电影金像奖最佳原创电影歌曲提名。8月发行的《夏日Fiesta》收录7首歌曲[168],主推的劲歌《夏日Fiesta》是当年8月红馆15场演唱会的主题曲[169],成为01年度十大劲歌金曲奖和十大中文金曲奖双料金曲;其他还包括电影《瘦身男女》插曲《我的伴侣》、《为爱瘦一次》,以及励志的《少林足球》插曲《男儿志》。'), Document(page_content='2002年7月推出的国语唱片《美丽的一天》是刘德华加入加际娱乐后的首张作品[170],包括10首国语和一首粤语歌,歌曲灵感全部来自10个感人的真实故事[170]。《练习》获得十大中文金曲优秀国语歌曲银奖和全国最受欢迎中文流行歌曲银奖[130],以及香港作曲家及作词家协会最广泛演出国语歌曲奖和第三届全球华语歌曲排行榜20大金曲,说唱的《黑蝙蝠中队》入选全球华语音乐榜中榜20大金曲,《天生天养》成为02年度十大中文金曲和十大劲歌金曲双料金曲[166]。该唱片为刘赢得全球华语歌曲排行榜最受欢迎男歌手荣誉,作为刘德华当年发行的唯一一张唱片,自此结束了其一直以来的一年内发行多张唱片的历史,标志着他将事业重心逐渐转向电影领域。\n\n2003年6月发行的《如果有一天》包括9首粤语和一首国语《月老》,其中六首由刘德华参与创作,刘德华作曲填词创作的《如果有一天》为道地绿茶广告歌,借此鼓励非典疫情过后的港人仍要以坚强乐观态度面对逆境[171][172],获得03年度十大劲歌金曲奖[166],另一首主要歌曲《17岁》由刘德华与徐继宗联合作词,回顾了刘从17岁踏入训练班到2002年的演艺生涯。2004年8月推出的又一张粤语专辑《Coffee or Tea》延续了刘德华参与创作六首歌的路线,由他与林夕包揽了所有11首歌曲的填词工作,两人通过对生活、身边事的观察道出自己所体味到的人生感慨[173],道地绿茶广告主题曲《常言道》获得04年度十大中文金曲奖以及十大劲歌金曲奖最受欢迎广告歌曲银奖,《按摩女郎》成为04年度十大劲歌金曲,《影帝无用》与《无须担心》是刘向其粉丝表达的心声之作。04年8月底开始在红馆举办一连15场的“Vision Tour”演唱会[174],随后于同年与2005年在中国的19座城市举办了“Vision Tour”巡回个唱[175]。当年刘德华不仅蝉联十大劲歌金曲奖亚太区最受欢迎香港男歌星,而且还第六次获得最受欢迎男歌星,成为史上首位同时获得这两大荣誉的男歌手[166][176]。'), Document(page_content='时隔三年之后,刘德华于2005年8月又推出一张全情歌的国语唱片《再说一次我爱你》,专辑以一个纯爱故事为架构,用十首歌独特地诠释不同角色对爱情的感受[177]。主打歌《再说一次我爱你》由刘德华与金牌搭档李安修联手填词,为刘德华主演的悲剧爱情片《再说一次我爱你》的电影主题曲,获得05年十大中文金曲奖和优秀流行国语歌曲奖铜奖、05年度十大劲歌金曲奖最受欢迎华语歌曲金奖,以及入选第六届全球华语歌曲排行榜年度20大金曲,该唱片亚洲销量超过150万张[178],并成为全球华语歌曲排行榜最佳专辑,更为刘德华赢得第三次全球华语歌曲排行榜最受欢迎男歌手荣誉[179]。同年底发行的《继续谈情(新曲+精选)》收录28首歌曲,其中新歌主要包括主打的《继续谈情》、道地绿茶广告主题曲《我得你》、电影《无间道》主题曲的独唱版和2005年拜年歌曲《恭喜发财》,《继续谈情》成为05年度十大劲歌金曲[166],《恭喜发财》最早是刘德华在春节联欢晚会上表演的曲目[180],后来成为商家在春节期间经常播放的一首喜庆拜年歌。\n\n2006年8月发行的粤语新碟《声音》是一张关注人性、缓解压力的唱片[181],刘德华填词的《张开眼睛》为道地极品乌龙茶广告歌,获得06年度十大劲歌金曲和最受欢迎广告歌曲金奖,以及RoadShow至尊音乐颁奖礼至尊歌曲;《累斗累》成为06年度十大中文金曲;专辑成为2006年度新城劲爆颁奖礼劲爆创作专辑。其中唯一的一首国语歌《心肝宝贝》是刘德华填词的慈善歌曲,成为中国乙肝防治疾病教育暨首届全国“爱肝日”主题曲[182]。该年度是刘德华最后一次参加十大劲歌金曲和十大中文金曲颁奖礼,标志着音乐事业占其演艺生涯的比重开始明显下调。'), Document(page_content='2007年7月推出涉及爱情、环保、全球暖化、人生态度等多个主题的国语唱片《一只牛的异想世界》,有幽默、欢笑、感伤和温暖等丰富的情感;曲风也很多元化,既有“刘式情歌”,也有软式Hip-Hop的街头舞曲以及R&B。[183]主打的《牧笛》是一首讲述牛郎与织女爱情传说的情歌,方文山填词的《一》是刘德华很少演绎的中国风曲目,赢得07年度RoadShow至尊音乐颁奖礼至尊歌曲,并为刘赢得日本MTV音乐录影带大奖最优秀BuzzAsia大中华区歌手大奖,专辑唯一的粤语歌《只想抱抱》为道地绿茶广告曲,成为07年度新城劲爆颁奖礼劲爆歌曲和劲爆原创广告歌曲。同年12月5日刘德华正式加盟寰亚集团老板林建岳旗下的东亚唱片[184],成为东亚一哥。[185]同时发行新曲加精选集《Everyone is No. 1》[186],主打歌《Everyone is No.1》是刘德华与李安修为2008年北京残奥会创作的奥运歌曲,目的是激励残疾运动员,另一首新歌《一起嗌》是年底红馆16场跨年演唱会的主题曲[187]。2008年在台北、新加坡和悉尼三地各举办了两场海外巡回演唱会。[188]\n\n2009年2月推出的《希望·爱》希望在经济逆境之中带给乐迷一份“希望”和“爱”,包括4首国语歌以及十首粤语新歌共14首歌曲[189],《长途伴侣》、《你是我所有》、《未到伤心处》为其中的代表作,它成为09年度IFPI香港唱片销量大奖十大销量广东唱片。同年7月发行的粤语精选集《长途伴侣》收录了10首道地绿茶广告歌曲[190]。当年“Wonderful World”中国巡回演唱会在广州、合肥等9个城市上演[191],连同07年的呼和浩特、南宁等15站16场在内[192],该系列演唱会一共在24个中国内地城市举行。\n\n至2010年,刘德华发行的新歌专辑有50多张,整个1990年代到2000年代前期,刘一直处于华语歌坛的颠峰状态;2000年代中后期,由于新生代歌手的崛起和其本人年龄的因素,导致新歌影响力不如从前,不过其唱片销量还是一直有一定的保证[178][193][194]。至2000年代,刘德华的唱片销量在各地累计超过4800万张,为华语歌手中的佼佼者[195]。'), Document(page_content="至2010年,刘德华发行的新歌专辑有50多张,整个1990年代到2000年代前期,刘一直处于华语歌坛的颠峰状态;2000年代中后期,由于新生代歌手的崛起和其本人年龄的因素,导致新歌影响力不如从前,不过其唱片销量还是一直有一定的保证[178][193][194]。至2000年代,刘德华的唱片销量在各地累计超过4800万张,为华语歌手中的佼佼者[195]。\n\n在入行30周年之际,为了用自己的歌声诠释那些曾经影响自己的经典作品,刘德华于2010年10月推出了以翻唱许冠杰、邓丽君、蔡琴等人的名曲为主的怀旧专辑《忘不了的》,它以1970年代和80年代的国语、粤语经典老歌为主[196],《掌声响起》、《大眼睛》、《孤儿泪》、《最爱是谁》等20多首老歌都被他唱出了新的味道,当中仅有的两首新歌《珍爱舞台》与《I Don't Wanna Say Goodbye》分别为“Unforgettable”演唱会的国语版主题曲和粤语版主题曲,专辑成为2010年度IFPI香港唱片销量大奖十大销量广东唱片。“Unforgettable”演唱会率先一连20场在2010年底的香港红馆上演[197],之后于2011年4月至5月在北京、郑州、天津等11个城市又展开中国巡回[198][199][200]。2012年在香港发行粤语精选唱片《我们的刘德华》,成为2012年度IFPI香港唱片销量大奖最高销量广东唱片,刘德华也成为全年最高销量香港男歌手[201]。2013年刘德华又开启了以“ALways”为主题的巡回演唱会[202],9月至12月先后在上海、南京、广州、北京、大连和台北这六座城市举办了18场室内个唱[203],据台湾媒体报道,这18场演唱会总票房超过10.5亿新台币(约2.12亿人民币)[203],以场均1170万人民币票房成为年度华语演唱会场均票房的冠军。"), Document(page_content='2015年2月在央视春节联欢晚会上献唱自己填词的亲情歌曲《回家的路》,这是他第四次登上春晚现场表演,距离上次在2005年春晚上演唱《恭喜发财》已有十年之久。[204][205]2018年12月,时隔八年后刘德华再次在香港红馆举行连续20场的跨年演唱会,12月28日因为喉咙发炎而在演出现场宣布取消余下的演出,后来他争取到了2020年2月的红馆档期以便把余下的7场补回来[206],然而2020年1月在武汉爆发的肺炎疫情又令其香港演唱会被迫取消、内地巡回演唱会推迟举行[207][208][209][210],后来又于2021年2月宣布因疫情因素被迫取消内地演唱会[211]。2020年12月,刘德华推出的首张数字专辑《演·唱》上线,由奔跑怪物宣传营销,收录他近年演绎的新作与电影、广告主题曲共17首歌曲,其中由他原唱的13首作品均由他本人亲自作词。[212]\n\n创作及合作\n主条目:刘德华填词作品列表\n刘德华在创作方面主要擅长于填词工作,且主要为个人演唱作品效力,为其他歌手创作的总数只有20多首。他创作的第一首歌是1990年的《如果你是我的传说》,当时是在好友小美的支持和鼓励下才完成的[213]。至今他一共参与了超过150首歌曲的填词工作,其中大多数由个人单独完成,尤其是自2003年以来,他填词的作品占个人专辑的比例明显增多,例如《如果有一天》、《Coffee or Tea》、《再说一次我爱你》、《声音》、《一只牛的异想世界》和《演·唱》这多张唱片他个人填词的都在5首以上。填词是刘德华表达个人想法的一个主要途径,他的早期填词作品如《来生缘》、《谢谢你的爱》、《情人 Happy Birthday》等集中讲爱情,后来慢慢地将话题写得很广阔,写出很多不同风格的歌词,例如1999年的《回家真好》讲述家庭亲情,2000年的《你是我一生中最大的骄傲》是送给FANS的,2003年的《如果有一天》阐释了人生哲理,《17岁》是讲个人的成长经历,2006年的《心肝宝贝》是送给乙肝患者的慈善主题曲。[213]香港著名音乐人黄沾曾批评刘德华填词“不会有什么大成绩”[214][215],后来也夸口称赞刘德华填词有很大进步。[216]'), Document(page_content='刘德华的创作才华也获得了多个奖项的认可:1998年与1999年连续获得商业电台举办的叱咤乐坛流行榜叱咤唱作人大奖,2001年获十大劲歌金曲最受欢迎唱作歌星银奖,2006年获最受欢迎唱作歌星金奖;2006年与2007年连续成为新城劲爆颁奖礼全球劲爆创作歌手。比较知名的优秀个人作品有《绝望的笑容》[213]、《如果你是我的传说》、《来生缘》、《谢谢你的爱》(粤语版)、《这一生是给你一个》、《情深的一句》、《你是我的女人》、《爱你一万年》、《心只有你》、《男人哭吧不是罪》、《当我遇上你》、《心蓝》、《你是我一生中最大的骄傲》等,与别人合填的有《冰雨》、《17岁》、《如果你有事》、《恭喜发财》、《再说一次我爱你》以及《Everyone is No.1》等。同时作词作曲的有《天天想你》(与巫启贤联合作曲)、《如果有一天》、《幸福这么远那么甜》和《余生一起过》[217]等。\n\n杜自持、李安修、陈耀川和陈德建[218]这四位音乐人是刘德华音乐事业上最重要的合作搭档。其中杜自持除了为他作曲及编曲其极大多数的粤语歌曲外,更是刘德华历年来大部分演唱会的音乐总监[219];陈耀川是刘德华90年代的“御用”作曲人,参与作曲的以《忘情水》、《天意》、《真永远》、《相思成灾》、《中国人》最具代表性[220][221];陈德建参与作曲的有《当我遇上你》、《为爱瘦一次》、《我的胖侣》和《Everyone is No.1》等,他也参与了许多刘德华唱片的监制工作;而来自台湾的李安修无疑是刘德华音乐上最亲密的合作伙伴,他不仅参与了《忘情水》、《天意》、《真永远》、《相思成灾》、《中国人》、《木鱼与金鱼》、《练习》、《再说一次我爱你》等多首经典歌曲的作词工作[222],还一直以来长期担任刘德华唱片的总监一职,李安修因此有“刘德华御用创作人”之称。[223]'), Document(page_content='主要奖项\n刘德华获得的流行歌曲奖项已超400个,为至今华语乐坛获奖最多的流行歌手。早在2000年就已经以累计收获292个音乐奖项成为粤语歌手之冠而荣登健力士世界记录当中[4]。其中在无线电视举办的十大劲歌金曲颁奖典礼上累计共有21首歌曲获得十大劲歌金曲奖,其中91年有三首同时获奖,92年与93年各有两首获奖[224],他获得六次最受欢迎男歌星(1990-1992、1994、1999、2004年)和十次亚太区最受欢迎香港男歌星(1993、1995-1996、2000-2006年),这些荣誉皆为男歌手之冠,然而美中不足的是作为歌曲奖最高荣誉的金曲金奖他却一直没有获得过。在香港电台举办的十大中文金曲颁奖音乐会上获得七次全国最受欢迎男歌手奖(2000-2006年)和15次优秀流行歌手大奖(1994到2008年度),从1990到2006年度共有21首半(《无间道》为合唱曲)歌曲获得中文金曲奖[225],仅次于张学友的23首半,另有11首国语歌获得优秀国语歌曲奖,其中金奖有《不能没有你》、《忘情水》、《中国人》、《笨小孩》、《木鱼与金鱼》和《我不够爱你》六首,银奖有《真永远》、《相思成灾》和《练习》三首,铜奖有《我的心只可容纳你》和《再说一次我爱你》这两首。在新城劲爆颁奖礼上他多次成为大赢家,共获得八次“新城全球劲爆歌手奖”、八次“新城劲爆亚洲歌手大奖”以及八次“新城劲爆男歌手奖”,皆为歌手之冠[226];而在新城国语力颁奖礼上他也多次成为国语力歌王和国语力香港歌手大奖得主[227]。以及在1998、1999、2001及2002年度夺得四台联颁音乐大奖传媒大奖歌手奖,四度成为四大音乐颁奖典礼最大赢家。'), Document(page_content='除了香港本土,刘德华也获得了台湾、中国大陆、新加坡和马来西亚、日本与韩国,以及北美一些机构授予的许多流行歌手荣誉[228]。在Channel V主办的全球华语音乐榜中榜上,从1994年至2002年刘德华共有10首歌曲入选榜中榜年度20大金曲,96至98年连续三届获得传媒推荐奖,1999年与2000年分别荣获跨世纪男歌手和最受欢迎歌手大奖[228]。在亚洲七家华语电台共同举办的全球华语歌曲排行榜上,从2001年到2006年他共有6首歌曲入选排行榜20大金曲,并在2002年的第二届、2003年的第三届和2006年的第六届先后三次获得最受欢迎男歌手奖[228],至今为获该荣誉最多的男歌手。其他地区奖项还有:1990年代台湾民生报金曲龙虎榜多届最受欢迎歌手,1992年北京电视台的最受欢迎歌星奖,1993年上海电视台的最受欢迎天王和四川国际电视节最受欢迎歌星奖[228],1993年至1998年连续获日本杂志《Club香港仔》评选的全日本明星人气奖及最受欢迎外国歌手第一名[228],1993年韩国电视台评选的全亚洲最受欢迎男歌手[228],1994年加拿大多伦多美加华语电台至爱男歌手[228],94年、95年、98年、99年和2001年新加坡金曲奖最受欢迎男歌手[228],1995年泰国最受欢迎男歌手,1995年与1996年连续获得Channel V与美国Billboard杂志联合颁发的亚洲最受欢迎歌手奖[229][230],以及1997年澳洲中文广播电台评选的97年度南半球最受欢迎男歌手等等[228]。'), Document(page_content='演唱会\n主条目:刘德华演唱会列表\n1991年,刘德华凭借其在电影方面的影响力,在韩国汉城(今首尔)首尔奥林匹克体操竞技场举办了一场演唱会,这是他举办的首场个人演唱会。1992年赴美国与加拿大举办的八场个唱为其首次巡回演出[188]。1993年1月,首次于红磡体育馆举办了20场的在港个人演唱会[141]。之后1994年与1996年又各举办了20场,1999年、2001年与2004年的夏季各举办15场,2007年、2010年和2018年年底各举办了16场、20场和13场(2018年原定20场,因喉咙发炎被迫取消了7场)的跨年演出[187][197],累计起来目前他已在香港红馆开唱154场。1993年刘德华首次到中国大陆展开了23场的室内巡回演唱会[188],为其首次中国巡演活动。1997年与1998年在内地累计举办20场[188];2000年的中国巡演在济南、沈阳等10个城市展开[188]。2001年与2002年的“夏日Fiesta”巡演合计在武汉、大连、南昌、西安等10个城市举行[188]。2004年至2005年的“Vision Tour”中国巡回在上海、苏州、西安、无锡等19个城市上演[188]。2007年的“Wonderful World”中国巡回从呼和浩特开始到成都结束共在15个城市举办[192],其中上海站一连举办了两场;2009年继续进行了广州、合肥等9个城市的“Wonderful World”中国巡回个唱[191]。2011年在北京、郑州和天津等11站举办“Unforgettable”中国巡回演出[198]。2013年开启的“ALways”中国巡回个唱选择在上海、南京、广州、北京和大连这五座城市的体育馆举行[231],以达到同香港红馆四面台一样的室内效果。至今刘德华已在中国大陆各城市举办了132场个人演唱会,其中上海为其举办场次最多的内地城市。由于创下过许多城市的票房上座和现场火暴记录,刘德华也被一些中国媒体和演出商誉为“华语歌坛票房第一人”[232][233][234][235]。'), Document(page_content='除了香港和中国大陆,刘德华也多次到台湾、新加坡、马来西亚,以及北美的温哥华和多伦多等华人聚集的城市举办演唱会[188]。从1991年到2013年之间除了2006年和2012年外,刘德华每年都举办了多场演唱会,其中1996年以累计举办47场为其演唱会最多的一年[188]。其演唱会顺序大多都是先在香港举办连续多场的个唱,然后再到各地巡演,不过2007年与2013年这两年却以中国巡演为开端,然后才赴其他地区举办。在演出内容上,香港本土以粤语歌曲为主,各地巡演则以国语歌曲为主,而《一起走过的日子》和《忘情水》[128]这两首经典代表作是其演唱频率最多的歌曲。刘德华在每次巡演前都会学习一些新的舞蹈以表演给歌迷[236],如2001年的拉丁舞[169]与2004年的踢踏舞[237]。其演出现场经常以劲歌热舞为开端,中间会安插一些表演和歌唱同时进行的以爱情为主题的音乐剧[238][236][239],而且从头到尾刘德华与歌迷、观众交流互动的机会比较多[157]。由于多年来刘德华陆续演绎了许多首广为流行和传唱的经典歌曲,因此《谢谢你的爱》、《忘情水》、《天意》、《中国人》、《笨小孩》、《冰雨》、《爱你一万年》、《练习》等名曲在个唱上常常会引起集体大合唱[128]。从1994年至今,刘德华已发行11张个唱影碟,其中在香港红馆录制的有1994、1996、1999、2001、2004、2007和2010年共七张,2002年的《你是我的骄傲演唱会》于12月6日在香港伊利沙伯体育馆举办,是为庆祝他入行20年而专门为三千名华仔天地会员举办的一次免费演出[240]。另外三张冠名为中国巡回演唱会的影碟,分别是在2004年的北京工人体育场、2007年和2011年的上海体育场录制的,这开创了歌手在北京和上海这两大能容纳6万名以上观众的体育场发行演唱会影碟的先河,其中北京演唱会不仅入选中国演出家协会评选的“2004中国十大演出盛事”,而且还是2004年中国单场演出票房最高的一场演出[241]。'), Document(page_content='刘德华2018年12月在香港举行红馆演唱会因身体不适被迫腰斩,他其后宣布2020年举办除了7场补场外,还会加开5场演出。[242]2019年9月,刘德华在新加坡演唱会中度过58岁生日,获过万粉丝齐唱生日歌。[243]2022年9月3日晚20点,刘德华在抖音直播间举办了一场“把我唱给你听”线上演唱会,这是他继2021年出道40周年在抖音直播后第二次在抖音直播,从开始的《笨小孩》到最后的《17岁》,2小时的演出的在线观看人数最终达到3.5亿人次,各项观看数据创造了云演唱会的直播记录[244][245][246][247][248][249]。\n\n个人生活\n恋情绯闻\n1981年刘德华当TVB训练班学员时期有一位已交往3年多的圈外初恋女友,却由于聚少离多两人在太平山顶分手(女方提出)。[18]因合作《神雕侠侣》刘德华爱上了“小龙女”陈玉莲,不过在向她表白爱意时被拒,当时她心有所属[250]。1983年秋刘德华到台湾拍张彻电影《上海滩十三太保》,当年的新艺城电影公司公关介绍他与琼瑶的电影公司的艺人喻可欣认识,当时正值走红时期的刘德华公开与喻可欣的恋情,但两人三年后分手[251]。喻可欣撰写的回忆录《情海星空——我与刘德华》于2005年出版,该书披露了当时两人相恋的过程[252][253]。关之琳与刘德华合作了十多部电影,刘曾公开表示欣赏她,更直指对方是他的最佳情人,而关之琳亦曾也间接承认刘德华很帅,评价他是“很全面的演员”,“拍戏时很照顾人……让人很有安全感,是绝种好男人”加上双方的粉丝支持此配对,故绯闻传得闹哄哄;直至1998年,刘坚称两人从没谈过恋爱。[254]'), Document(page_content='家庭生活\n刘德华妻子是马来西亚的闽南人模特儿朱丽倩[255],两人于1986年经刘德华的朋友介绍认识,有传当年是叶倩文介绍,另说是刘德华当时的经纪人张国忠介绍的,因朱丽倩与张国忠是亲戚。1990年代到2000年代媒体不断报导两人交往之消息,但皆未获双方正面承认。2008年两人联名捐款一万元做善事,加上朱丽倩现身刘德华演唱会,因而被疑早已结婚。直到2009年,朱丽倩的父亲于马来西亚过世,刘德华的名字出现在讣告上,二人的关系才正式公开,媒体还证实两人已于2008年在拉斯维加斯注册结婚,刘德华于媒体刊出结婚报道的当日于其官方网站“华仔天地”发表留言《对不起》,表示“我惭愧未能守住我的承诺先告诉大家,让信任我的家人、朋友、媒体朋友难堪,对不起。正在工作当中,一时间不能尽诉,容后向你们说明白——华仔”[256]。\n\n2011年11月28日,刘德华在其官方网站发表一篇名为《报喜》的文章,其中提到“吾家有喜”证实了妻子已怀孕的消息[257]。次年5月9日,朱丽倩在香港养和医院产下一女。5月13日,他在官网以“一切安好”为题向粉丝们报喜,之后为女儿取名为刘向蕙,英文名是“Hanna”,古英文意指“优雅与欢欣的女神”[258],现就读于沪江维多利亚学校[259]。朱丽倩跟刘德华都是虔诚的佛教徒,平时习惯吃素食。刘也承认朱丽倩怀孕至孕后的一段时间,因为月嫂不会准备素食餐,所以所有膳食都是由刘德华和家人处理。[18][260]\n\n兴趣爱好\n刘德华笃信佛教,法名慧果,其师父是台湾灵岩山寺上妙下莲老和尚[261]。为了在香港演唱会上表演二胡演奏,1996年他趁在长春拍电影的空闲时间在当地颇有名气的二胡教授刘汉臣家学习了两个月的二胡演奏[262][263][264]。2000年3月22日,刘德华在北京举行拜师仪式,拜川剧大师彭登怀为师以学习“变脸”绝技[265],并学会了初步的变脸技巧[262]。刘德华在生活中热爱写书法[266]和打保龄球[267],其中他抄写的《心经》更是送给好友梅艳芳的礼物,但在2004年1月1日,即梅艳芳冥寿后两天被拍卖[268]。此外,他亦对造型颇有研究,因为还没出道时刘德华曾做过发型设计师[269]。另外,刘德华坚持每天喝一点混合果汁,比如苹果加红萝卜一起榨的汁,以保持自身的健康[270][271]。'), Document(page_content='主要事件\n遭“无线”雪藏\n1983年,演过《神雕侠侣》在无线电视正当红的刘德华不愿在续约5年的合同上签字,因为他坚信5年中自己的事业会有一个大的飞越。因为TVB不允许他把演艺重心放在电影,他要求公司将年期缩短但遭到了拒绝[18][272]。于是激怒了无线高层的他便遭到了雪藏——没有戏拍和在新闻媒体露脸的机会。那段日子除了偶尔参与体育、邮政、儿童联欢会之类的活动之外,便无主要演出机会。而在这段空闲的日子里,他反复观看自己以前演的电视录像带找出自己的不足,他也观看别人的片子记下别人的长处,然后思索改进自己的表演方法[273]。此外,他还勤练体格时常健身运动、经常练歌学习音乐[274]。期间他也曾数次主动找无线高层,希望通过谈判来化解自己和公司之间的矛盾,但双方一直没有达成共识[272]。\n\n1986年在邵逸夫主席的出面调解下,双方摒弃前嫌,握手言和,签下新合约[274]。而有关这次续约的内容(续约时间、签约剧目、薪酬数额等),双方都没有向外界披露[275]。长达400天的雪藏事件是他出道以来遭受的最大打击[276]。之后他就拼命拍戏、接拍了许多电影,其中以追女仔类型的喜剧片和古惑仔类型的江湖片为主[277]。\n\n与“天幕”的诉讼\n1991年刘德华创立天幕制作有限公司,他从演员转型为幕后投资者,是希望拥有自己的电影公司,可以帮助他拍摄更多不同类型的电影,也圆他的电影梦。起初经营颇为成功,也赚到不少钱。后期,因天幕经营失败令刘德华亏损4000多万港币[103]。2000年麦绍棠以上市公司中建电讯名义注资天幕公司,刘德华签约成为天幕公司旗下艺人。'), Document(page_content='与“天幕”的诉讼\n1991年刘德华创立天幕制作有限公司,他从演员转型为幕后投资者,是希望拥有自己的电影公司,可以帮助他拍摄更多不同类型的电影,也圆他的电影梦。起初经营颇为成功,也赚到不少钱。后期,因天幕经营失败令刘德华亏损4000多万港币[103]。2000年麦绍棠以上市公司中建电讯名义注资天幕公司,刘德华签约成为天幕公司旗下艺人。\n\n2002年,双方的经纪人合约于该年初届满,只剩下合伙关系,但双方合作伙伴关系恶化。刘德华向天幕公司追讨拖欠了他1500万港元的演员酬金,中建电讯透过旗下附属公司Noble Trend International Inc.(NTII)入禀高等法院,控告刘德华及他操控的Ablegate Group Limited(简称AGL)违约,令中建电讯失去出售一批总值1亿5360万港元股份的机会,向刘德华索取上述巨额赔偿。中建电讯更向法院申请禁制令,全面封杀刘德华为其他公司做唱片、接拍影视和广告等演出机会,等于全面封杀刘的演艺事业,结果禁制令成功,使得刘德华在禁制令生效期间估计损失收入上亿元。[111]最终双方在丽新集团老板林建岳的调停下达成和解协议[278]。\n\n承认为乙型肝炎带原者\n2006年8月30日,刘德华以乙型肝炎防治宣传大使身份到北京友谊医院探访两名乙肝及肝癌病人,并送上新碟鼓励他们积极面对病魔。其后他到北京人民大会堂出席“2006肝炎防治宣传教育活动启动”记者会,宣布将担任大使两年,还与林家栋合作拍摄宣传片,由他填词的《心肝宝贝》作主题曲。出席记者会期间刘德华坦承少年时验血后得知自己也是乙肝带原者,当时医生指他还年轻,没有大碍,他说:“预防胜于治疗,这个病患癌比率较高,所以我年年都做身体检查,不过我不太担心,没甚影响。”[279]'), Document(page_content='杨丽娟事件\n主条目:杨丽娟事件\n发生于2007年3月的杨丽娟父亲杨勤冀跳海自杀事件曾轰动一时[280][281]。杨丽娟本是甘肃兰州人,后于1994年迷上了刘德华,此后便沉溺于想见刘德华之中。其父母为达成女儿心愿倾家荡产,父亲还曾卖过肾,并于2007年筹募旅费到香港终于见到刘德华;然而,当3月25日杨丽娟在歌迷会上已如愿见到刘德华并合影后,她却并不满足于只与刘德华合影纪念。次日凌晨,杨父在香港跳海自杀,留下的遗愿只是希望刘德华再单独见女儿一面。刘德华曾于2006年在媒体上斥责杨丽娟让父卖肾是“不忠不孝”[282],事后对杨父的死感到“伤悲”,他也担心以后再发生其他粉丝的疯狂举动,并找心理医生帮忙[283][284]。\n\n该事件发生后引起媒体广泛报道和网友的热议,绝大多数人认为杨丽娟的追星行为太激进太过偏执[285],是导致他父亲自杀的根源[286]。此外也引起许多热议的话题,例如父母对孩子进行家庭教育的重要性[287],年轻人要理智追星首先要有正常的个人生活,追星要学习偶像的优点等等[288][289][290];而一些媒体为了制造吸引目光的报道曾资助过杨丽娟去见刘德华,则引起了公众对媒体就杨丽娟之前报道的方式和过错责任的反思和指责。[291]\n\n勇救歌迷事件\n2007年11月13日,平面媒体以刘德华在电影《天若有情》的角色“华Dee(英雄)上身”,来形容刘德华在11月6日成都演唱会中挥拳意图阻止保安员围殴一位歌迷的事件[292]。根据报导,一位年轻的男歌迷在突破保安的重重屏蔽后来到舞台前,向刘德华献花及跟他握手后,该歌迷就被十多名保安包围及围殴。刘德华在舞台上大声喝止保安的粗鲁行为,然而保安人员未理会,于是刘德华立即由高达两米的高台跳落地面,为歌迷顺利解围并护送离开。刘的此举令全场6万多观众感动和喝彩,该事件经过报道后获得许多网民的热烈反响和赞扬[293]。事后刘德华也重申,歌迷应该遵守场内大会的秩序。[294]\n\n泰国坠马事故\n2017年1月17日,刘德华在泰国南部的寇立为道地饮品拍摄广告片时,出意外从马背上摔了下来,造成盆骨有撕裂伤。当时有数匹马在场,他所骑的马忽然失控,将他抛下,被马蹄踩到腰脊令腰脊骨裂。之后立刻被送去泰国一间医院治疗,因为腰脊受伤,行动不便,必须坐医疗专机回港,再接受香港医生诊治。专机当晚午夜到港,随即送往养和医院接受治疗。[295]'), Document(page_content='泰国坠马事故\n2017年1月17日,刘德华在泰国南部的寇立为道地饮品拍摄广告片时,出意外从马背上摔了下来,造成盆骨有撕裂伤。当时有数匹马在场,他所骑的马忽然失控,将他抛下,被马蹄踩到腰脊令腰脊骨裂。之后立刻被送去泰国一间医院治疗,因为腰脊受伤,行动不便,必须坐医疗专机回港,再接受香港医生诊治。专机当晚午夜到港,随即送往养和医院接受治疗。[295]\n\n2017年3月10日,刘德华宣布出院回家,他表示自己很快就能够站起来。[296]同年8月,为电影《侠盗联盟》进行宣传活动而正式复出工作。\n\n支持东大屿山填海工程\n2018年,刘德华公开为团结香港基金拍摄影片《让下一代看见》[297],片长约三分半钟,他在影片中支持面积1,700公顷的东大屿填海工程,指人工岛填海“可取”。因此他受到一些人士的批评,并指其身为保育大使却谋杀生态环境。其后特首林郑月娥公开表扬刘的支持,对其能够勇于表达意见感到钦佩,惟对刘被一些人侮辱、人身攻击感到不公道,称自己和刘德华都遭到网络欺凌,认为“光有科技知识而无品德道德的人,如网络黑客,对社会构成危险。”[298][299][300]她并祝愿刘的演唱会成功。[301]'), Document(page_content='奥迪广告文案抄袭事件\n2022年5月21日,是中国传统节气“小满”,刘德华在其抖音账号、一汽奥迪在各官方渠道发布了由刘德华主演的视频广告《人生小满》,该视频引发大量关注和转发。当晚,抖音账号“北大满哥”发表视频,称该广告视频涉嫌抄袭他在2021年5月21日的一条视频文案。5月22日,奥迪发布声明称该视频由创意代理公司M&CSaatchi提报并执行,因监管不力、审核不严向刘德华和“北大满哥”道歉并下架广告视频。[302]数小时后,广告创意代理方上思广告声明称视频文案确实抄袭了“北大满哥”的“小满”视频中的文案内容,并向“满哥”道歉;不过有媒体报道显示,拍摄此广告的导演彭杨军还有其他作品涉嫌抄袭(比如2021年8月为BMW8系x良仓制作的创意广告)[303]。同日下午,刘德华在官方后援会华仔天地发文表示:“对原创我是百分百的尊重,今次事件,对于广告团队在创作过程中出现的问题,以及对满哥造成的困扰,我个人深感遗憾。Audi和广告公司现正认真处理中。”[304]5月25日“满哥”表示,两个公司的负责人向他进行了当面道歉,他愿意接受这份道歉。并称三方已达成协议,他将免费授权让广告使用文案。[305][306]\n\n公益活动\n刘德华笃信佛教、热心公益事业,如为1991年华东水灾、1999年台湾921大地震、2001年内蒙古雪灾[307]、2004年印度洋海啸[308]、2008年汶川大地震[309][310]、2009年台湾八八水灾[311]、2010年青海玉树地震[312]、2011年东日本大震灾[313]等举办的各类慈善演出和募捐活动都能看到他积极投入的身影。他也曾先后担任多个组织单位的公益活动大使,并拍摄了不少公益宣传片,如“爱在阳光下—预防艾滋病”公益宣传片、“爱盲行动”公益宣传片和“中国产质量量电子监管网”公益宣传片[314]等等。'), Document(page_content='他本人于1994年成立了“刘德华慈善基金有限公司”,旨在支持弱势社群及帮助有需要的人士[315]。而他对残疾人也非常关心[316],自从1992年巴塞罗那残奥会后,他每年都会拿出10万元港币资助香港残障运动员,他也因此与香港“痉挛飞人”、三届残奥会金牌得主苏桦伟保持着很好的私人关系[317][318]。2007年励志歌曲《Everyone Is NO.1》的MV是他个人出资150万港币花3天时间辛苦拍摄的[319],以此来激励更多伤残人士勇敢生活和拼搏[320]。他对残障运动员的付出也让他于2010年4月当选“中国残疾人福利基金会”理事及副理事长,而在2011年6月则再次被推选为该基金会副理事长[321],2013年12月他又当选为“香港残疾人奥委会暨伤残人士体育协会”副会长[14]。')]

下面是将元数据与文档一起传递的示例,请注意,它与文档一起拆分。

with open("./files/chenglong.txt") as f:chenglong = f.read()
metadatas = [{"document": "liudehua.txt"}, {"document": "chenglong.txt"}]
documents = text_splitter.create_documents([liudehua, chenglong], metadatas=metadatas
)
# print(documents[0])
print(f"{documents=}")

输出结果示例,

documents=[Document(page_content='刘德华,BBS,MH,JP(英语:Andy Lau Tak Wah;1961年9月27日—),香港男演员、歌手、填词人、监制及出品人,1990年代获封为香港乐坛“四大天王”之一[3],也是吉尼斯世界纪录大全中获奖最多的香港歌手[4];在影视方面,他三次获得香港电影金像奖最佳男主角奖,两次获得金马奖最佳男主角奖,至今参演电影超过170部[5]。刘德华是天幕公司和映艺集团的创建者,作为投资人与监制已参与制作了30多部华语电影[6]。除此之外,刘德华是四川省川剧学校客座教授[7]。\n\n1999年,刘德华获得“香港十大杰出青年”的荣誉,2000年11月则顺利荣登“世界十大杰出青年”[8],成为获此殊荣的少数几位香港艺人。2006年7月7日,香港演艺学院因他“是香港最受尊重和喜爱的演艺名人之一,对香港电影及音乐贡献良多。其严谨专业的工作态度,足以成为年轻人的典范”,为了“表彰他在表演艺术方面的成就”而授予刘德华荣誉院士称号[9],他也因此成为少数几位获此荣誉的香港艺人之一[10]。\n\n刘德华笃信佛教,法号“慧果”,热心公益,时常参与慈善活动。2008年,刘德华获香港特别行政区政府委任为太平绅士[11],2010年4月23日,刘德华获任中国残疾人福利基金会理事并担任副理事长[12]。2010年5月2日,刘德华获颁第十二届“世界杰出华人奖”同时获颁授加拿大纽奔驰域蓝仕桥大学荣誉博士学位[13]。2013年12月8日,他又当选香港残疾人奥委会暨伤残人士体育协会副会长[14]。2017年12月他因演艺事业和公益事务上的成就被香港树仁大学授予荣誉文学博士学位。2018年6月受邀加入美国电影艺术与科学学会成为会员[15]。\n\n\n刘德华出生于香港新界大埔泰亨村(旧称菜坑村[注 1])[16],籍贯广东新会县荷塘镇(今江门市)[17]。祖父在当时算是大地主(乡村、农地)[18]。另外,他在家中亦有三姊、一妹和一弟(刘德盛)[19][20][21],自己在家中排行第四[22]。其父刘礼年轻时为启德机场的消防员[16]。', metadata={'document': 'liudehua.txt'}), Document(page_content='刘德华出生于香港新界大埔泰亨村(旧称菜坑村[注 1])[16],籍贯广东新会县荷塘镇(今江门市)[17]。祖父在当时算是大地主(乡村、农地)[18]。另外,他在家中亦有三姊、一妹和一弟(刘德盛)[19][20][21],自己在家中排行第四[22]。其父刘礼年轻时为启德机场的消防员[16]。\n\n刘德华五岁多时由于任职驻守机场消防员的父亲希望他能入读英文小学而随家人离开了农村[注 1],全家后来搬到了九龙钻石山大磡村(曾就读村里的大磡村街坊福利会小学)[23]。钻石山为贫民区,多是木屋,容易发生火灾。刘家的木屋在刘德华十一岁时被大火烧毁,家人因此住在寮屋一年[18],家人后来再搬到蓝田邨第十五座。[24]在刘德华五、六岁时,父亲还开了一间名叫“得胜士多”的小吃杂货店以赚钱维持家用[注 1];刘德华与姐姐们则经常担任店里的帮工一起干活,当时负责写菜名的他为日后写下一手好的毛笔字奠定了基础[25]。离店不远处有一家“坚城片场”,往片场送外卖的他也能常见到曹达华、石坚、冯宝宝等当红演员拍戏时的模样[26]。因为父亲嗜吃叉烧,后来刘德华更把蓝田邨十五座地下的“华东烧腊”买下来送予父亲,现时他和父母都住在加多利山大宅[27],而其大姐一家则住在大围新翠邨公屋。[28]\n\n刘德华,出生时取名“德华”,在就学阶段曾取学名为“福荣”,刘福荣只是学名而非本名,“刘德华”就是本名[29],他本人在《鲁豫有约》、《康熙来了》中曾亲口公开澄清此事。[30][31] 刘德华在黄大仙天主教小学毕业后[32][注 1],升读位于新蒲岗的英文中学可立中学[33]。升读可立之后,刘德华于就读中一级时曾因英文科成绩差而留级一年[注 1],经补习后继续升班[注 1]。与校内要好的同学走在一起,还自号“可立七侠”[25],同时,他参加校外中小学跳弹床公开比赛[注 2]。亦热心参加校内外学校剧社的表演[注 2],参与幕后制作负责编剧[注 2],而教授他有关戏剧方面知识的地理科老师,就是后来的著名舞台剧编剧杜国威[33][注 2]。刘德华在中五会考获得1B3D2E(中文读本A)的成绩,中六上学期后,到香港电视广播有限公司(TVB)的艺员训练班受训[34]。此前他在中学阶段开始到慈云山踢足球[注 2],与黄日华识于微时[注 2];当时刘担任守门员[注 2],黄担任前线球员[注 2]。', metadata={'document': 'liudehua.txt'}), Document(page_content='1980年刘德华为了想当导演而入读第10期无线电视艺员训练班[35][36][注 3],著名的同期同学有吴家丽、梁家辉、戚美珍、张之亮、徐锦江等,1981年毕业后任无线电视台演员[34]。在香港电台电视部制作的电视单元剧《香港香港8:江湖再见》里首次演出[37]。其后在李添胜监制的时装警匪电视剧《猎鹰》里首度担演男主角饰演一名投身警界的青年警察而开始走红[35]。\n\n1983年受TVB力捧,与黄日华、梁朝伟、苗侨伟和汤镇业组成“无线五虎将”[35],相继出演了1983年萧笙监制、与陈玉莲合作的50集武侠剧《神雕侠侣》,1984年李添胜监制、与梁朝伟合作的《鹿鼎记》等多部很受欢迎的无线剧集,其中在片中饰演杨过的《神雕侠侣》不仅是刘德华最为重要的电视剧代表作[38],其人气甚至让他成为电影投资方,导演等重用的新晋,奠定他往影坛发展基础。1999年该剧为刘德华赢得TVB无线千禧“我最难忘的男主角”荣誉,而且还被金庸先生于2003年选为他最满意的根据其小说改编成的两部电视剧之一(另外一部是1976年郑少秋主演《书剑恩仇录》)[39]。\n\n刘德华于1982年开始参演电影,首部作品是吴小云执导的《彩云曲》[35],其中刘的戏份比较少。第一部参演的重要电影作品是1982年许鞍华执导的表现越南战后普通人生活和移民香港题材的《投奔怒海》[37],获得第二届香港电影金像奖最佳新演员提名,不过败于以同一电影提名的女演员马斯晨[40]。1983年霍耀良执导的《毁灭号地车》是刘德华首部担纲男主角的电影。\n\n1985年吴思远执导、刘德华与叶德娴主演的法庭剧情片《法外情》是刘德华早期主演电影中的一部重要代表作[41]。刘在片中扮演一位年轻的律师在法庭上唇枪舌战的表现不俗,而法庭外与身世有关的感情戏则比较赚人眼泪。《法外情》的成功促使主创们后来又拍摄了两部续集《法内情》和《法内情大结局》[42]。另外,这时期刘跟洪金宝等人合作的群星动作片《最佳福星》,以及与周润发合作的江湖片《江湖情》都获取了良好的票房成绩。', metadata={'document': 'liudehua.txt'}), Document(page_content='1988年至1992年是刘德华拍片量最多的时期,这五年他参演了超过50部作品。其中演出最多最成功的类型是黑社会江湖片,并塑造了多个成长于草根、身在江湖却有情有义英雄未泯、却以悲剧收场的“情深烂仔”、“良心古惑仔”与“悲剧英雄”角色,深深影响当时的年轻人[43][44]。1988年他与张曼玉和张学友合作王家卫的导演处女作《旺角卡门》,塑造了一个重情重义的江湖混混华仔形象,使其首次获得香港电影金像奖最佳男主角提名[45],该片也为刘赢得首座表演奖杯——台湾金龙表演艺术奖最佳演员奖[35];1989年由向华胜、王晶联合执导,刘与谭咏麟合作的黑帮赌片《至尊无上》票房达2300多万港币,是为数不多的讲述兄弟情义的港产赌片。1990年他与吴倩莲在陈木胜的导演处女作《天若有情》中,演绎了小混混华Dee与千金小姐JOJO之间一段刻骨铭心的浪漫生死恋,感动了华语地区及韩国等地许多观众[46],本片的成功也导致后来他与吴倩莲在杜琪峰执导的1991年作品《至尊无上II之永霸天下》和1996年作品《天若有情III之烽火佳人》中合演情侣[47]。该时期他主演的其他主要古惑仔电影还有《同根生》、《飚城》、《狱中龙》等。\n\n而刘德华亦凭借其出众的偶像外型拍摄了大量的商业片,其中与著名导演王晶合作的次数最多,双方合作最具代表性的作品有以《最佳损友》系列、《精装追女仔II》、《与龙共舞》为代表的爱情喜剧片,刘德华在其中表现了喜剧表演才能,票房成绩也不俗;他与王晶合作的另一类主要电影是赌博片,如1989年与周润发合作的《赌神》,1990年与周星驰合作的《赌神》续集《赌侠》,都成为当时非常卖座的商业类型片[43][48],这些作品使得刘德华的“赌侠”与周润发的“赌神”和周星驰的“赌圣”并列为港产赌片的三大代表角色[48]。90年代后期刘与王晶又合作了两部以King哥为主角的续集《赌侠1999》和《赌侠大战拉斯维加斯》,分别于1998年与1999年上映。[48]', metadata={'document': 'liudehua.txt'}), Document(page_content='此外,该时期比较知名的作品还有《九一神雕侠侣》和《五亿探长雷洛传》。1991年的《九一神雕侠侣》是刘德华成立的天幕制作有限公司拍摄的首部作品,是他与梅艳芳等人合作的一部现代奇幻浪漫动作片,收获了良好的反响和票房[49]。同年分为两部先后上映的《五亿探长雷洛传》由刘国昌执导,是一部改编自真人故事的传记片,刻画了一个香港警察雷洛在腐败横行的法治乱世中成长为巨贪枭雄的兴衰成败史[45],两部累计票房5300万,刘德华也凭借雷洛一角获得第11届香港电影金像奖最佳男主角提名[45]。《雷洛传》的成功使刘德华又接拍了表现澳门赌王传记题材的《赌城大亨》系列,也分成两部于1992年先后上映,获得不错反响[43][48]。不过,高产时期的刘德华也往往被认为“处理性格和情感没有深度,角色类型化”,影评人张伟雄说:“他喜欢在镜头里玩形态,玩火机,玩枪,玩小动作,连发型都不能改。可以说,他是同一时期一直演两种角色而已,路数甚窄。多产期还造就了刘德华在表演上的另一个大特点,就是模仿。”[43]', metadata={'document': 'liudehua.txt'}), Document(page_content='罗马拼音\tLau Tak Wah\n英文名\tAndy Lau\n昵称\t华仔、华哥、刘天王\n别名\t刘福荣\n国籍\t 中华人民共和国(香港)\n出生\t1961年9月27日(62岁)\n 英属香港新界大埔泰亨乡(菜坑村)[1]\n职业\t演员、歌手、电影制片、填词人、出品人\n语言\t粤语、英语、国语\n教育程度\t可立中学中六预科肄业\n无线电视艺员训练班\n四川省川剧学校注册学习[2]\n配偶\t朱丽倩(2008年结婚)\n儿女\t1女\n音乐类型\t华语流行、粤语流行\n演奏乐器\t人声、二胡、口琴\n出道地点\t 英属香港\n出道日期\t1981年,\u200b41年前\n出道作品\t《香港香港:江湖再见》(电视剧)\n《彩云曲》(电影)\n《只知道此刻爱你》(专辑)\n代表作品\n音乐作品歌曲创作影视作品\n活跃年代\t1981年至今\n唱片公司\t华星唱片(1985年)\n百代唱片(1987年至1989年)\n宝艺星(1990年至1992年)\n华纳唱片(1992年至1995年)\n博德曼音乐(1996年至2001年)\n百代唱片(2002年至2004年)\n东亚唱片(2005年至2016年)\n映艺音乐(2017年至今)\n经纪公司\t无线电视(1981年至1986年)\n艺能机构(1986年至1992年)\nICM(美国经纪公司)(1992年至1990年代末)\n中国星集团(1990年代至2003年)\n天中娱乐(2001年至2002年)\n加际娱乐(2002年至2005年)\n映艺娱乐(2005年至今)\n\n尽管香港电影业自1990年代中期已进入了产量锐减和票房下降的衰退阶段,不过刘德华的电影事业却一直在进步,佳作不断。[43]\n\n1993年刘镇伟执导的《天长地久》是天幕公司拍摄的一部浪漫剧情片,刘德华与刘锦玲和吴家丽合作诠释了一段演艺圈里的悲剧爱情故事,其缠绵悱恻的味道成为刘德华电影生涯为数不多的一部文艺片。[50]1994年刘德华投资的《天与地》在内地取景拍摄,讲述民国时期禁毒专员张一鹏到上海打击毒枭的故事,结局设计使得本片充满了悲剧色彩和批判意味。[51]', metadata={'document': 'liudehua.txt'}), Document(page_content='1993年刘镇伟执导的《天长地久》是天幕公司拍摄的一部浪漫剧情片,刘德华与刘锦玲和吴家丽合作诠释了一段演艺圈里的悲剧爱情故事,其缠绵悱恻的味道成为刘德华电影生涯为数不多的一部文艺片。[50]1994年刘德华投资的《天与地》在内地取景拍摄,讲述民国时期禁毒专员张一鹏到上海打击毒枭的故事,结局设计使得本片充满了悲剧色彩和批判意味。[51]\n\n1995年与梁咏琪合作主演尔冬升执导的赛车励志片《烈火战车》,片中其对阿祖叛逆、倔强和执著的心理刻画和多重情感纠葛的演绎让刘德华获得了第三次金像奖最佳男主角提名[45]。同年主演林岭东导演的《大冒险家》在菲律宾、香港和美国三地拍摄,它在大型枪战爆炸场面上的制作上比较精良[52]。90年代后期由于刘德华的天幕公司已累计亏损4000万,刘德华于是向向华强夫妇求助,并连续跟向氏的永盛公司和中国星集团合作,拍摄了《新上海滩》、《天地雄心》、《龙在江湖》、《赌侠1999》、《黑马王子》、《赌侠大战拉斯维加斯》等许多卖座商业片,这些作品都进入了香港年度票房前十。[53]其中在1996年潘文杰执导的《新上海滩》中演绎了一个从低层奋斗慢慢崛起最终遇害的黑帮大哥丁力新形象[54]。1998年与梁咏琪主演黑帮电影《龙在江湖》,其饰演的黑帮成员韦吉祥悲剧结局颠覆了导演王晶一贯的欢乐风格。这一时期已进入中年阶段的刘德华在《烈火战车》、《龙在江湖》和《赌侠1999》等片中的演绎突破了他以往塑造的年轻黑帮英雄形象,成为“反英雄”角色的代表[43]。', metadata={'document': 'liudehua.txt'}), Document(page_content='从1999年杜琪峰执导的《暗战》开始,刘德华摆脱了过去比较偶像化的演绎方法[55],不断深入角色性格与内心成功实现转型,塑造了许多不同身份与个性的角色[43],如《暗战》里身患绝症、与谈判专家斗智斗勇、为父报仇、亦正亦邪的华[55],《孤男寡女》中的销售部门经理华少,《阿虎》中悲情的拳击手孟虎,《瘦身男女》里贪吃又坚持自我牺牲的肥佬,《无间道》和《终极无间》中在警局里任高级督察的黑帮卧底刘健明,以及《大只佬》中经过多重考验后终于看透因果真谛的了因和尚等。这一连串作品不仅在票房和口碑上赢得佳绩[43],亦获第19届到23届连续五届的香港电影金像奖最佳男主角提名[45],其中凭借《暗战》和《大只佬》两度得奖[56],并入围第38届、40届和41届金马奖最佳男主角,以《无间道III》获奖[35]。此外,《阿虎》为他赢得第六届香港电影金紫荆奖最佳男主角奖[57],《大只佬》赢得第十届香港电影评论学会大奖最佳男演员[58]和第四届华语电影传媒大奖最佳男主角奖[59],《孤男寡女》、《瘦身男女》和《大只佬》为刘赢得三次演艺动力大奖最突出电影男演员称号。而《孤男寡女》、《瘦身男女》和《无间道》的大卖不仅巩固了刘德华的票房巨星地位[43],亦使得他与郑秀文成为当时很受欢迎的一对银幕情侣,而杜琪峰与刘德华和郑秀文三人也有了“铁三角”之称。[60]因此1999年至2004年是刘德华港产片时代的一段颠峰时期。\n\n2005年在陈德森执导的奇幻悲剧电影《童梦奇缘》中,刘克服挑战借化妆技术呈现了巨大年龄跨度的演出,他的表现不仅成为该片的最大看点,其光仔一角又获金像奖最佳男主角提名[61]。2006年参演尔冬升执导的毒品题材的警匪片《门徒》,在片中他将一位复杂个性之毒枭刻画得逼真到位,并以此片赢得一座金像奖男配角奖[62]。2007年,刘德华因其自1997年以来对香港电影的贡献而与著名监制江志强一同获得香港电台主办、香港电影金像奖协办的香港特区十周年电影选举杰出成就奖[63]。', metadata={'document': 'liudehua.txt'}), Document(page_content='合拍片时代\n随着2003年以来香港与内地的电影合作不断加深,刘德华也经常在合拍片中担任主角。2004年,先与中国著名导演张艺谋合作武侠片《十面埋伏》,该片获得了良好的国际票房与西方的好评[64];接着又与著名商业导演冯小刚合作犯罪剧情片《天下无贼》,被陈可辛称赞道成功演绎了一位颇有说服力的大陆人形象[43],获得第五届华语电影传媒大奖最佳男主角提名[65]以及香港电影金紫荆奖最佳男主角提名。2005年香港电影评论学会副会长登徒认为“刘德华应该算第一个在内地发展得很好的香港明星,他能找到与国内电影工作者合作的方法。”[43]\n\n2006年主演了香港文艺导演张之亮执导的中日韩合拍古装战争片《墨攻》,其饰演的主张“兼爱非攻”的墨家使者革离一角获得2007年亚洲电影大奖最佳男演员提名[66]以及香港电影金紫荆奖最佳男主角提名。2007年刘德华与李连杰、金城武合作陈可辛执导的古装战争巨制《投名状》,以片中粗犷直性、命运悲惨的草莽兄弟赵二虎一角获得第十次香港金像奖最佳男主角提名[67]。2008年在李仁港导演的古装动作片《三国之见龙卸甲》中展现了青年与老年两个阶段、胸怀壮志且表现勇猛的三国英雄人物赵子龙,成为刘德华本人比较满意的一个银幕角色。2010年在徐克武侠回归之作《狄仁杰之通天帝国》中,刘德华塑造了一个有勇有谋的大唐神探狄仁杰新形象,作为主演亦参与角逐第67届威尼斯国际电影节最佳男演员奖项[68],该片也获得了“目前最接近好莱坞标准的华语类型片”的史诗娱乐巨制的赞誉[69]。\n\n2011年刘德华投资并与叶德娴合作主演许鞍华执导的剧情片《桃姐》,在这部根据真人真事改编而成的老人题材的作品中了他饰演了一位很有生活质感的普通人,极具说服力的内敛演出让他先后在第48届金马奖和第31届香港电影金像奖上称帝[70][71][72]。2012年10月他被金马奖执委会委任为第49届金马奖评审团主席[73]。2013年又受邀担任第七届亚洲电影大奖评审团主席[74]。', metadata={'document': 'liudehua.txt'}), Document(page_content='2011年刘德华投资并与叶德娴合作主演许鞍华执导的剧情片《桃姐》,在这部根据真人真事改编而成的老人题材的作品中了他饰演了一位很有生活质感的普通人,极具说服力的内敛演出让他先后在第48届金马奖和第31届香港电影金像奖上称帝[70][71][72]。2012年10月他被金马奖执委会委任为第49届金马奖评审团主席[73]。2013年又受邀担任第七届亚洲电影大奖评审团主席[74]。\n\n时隔多年之后,他再次与杜琪峰和郑秀文合作,在2013年推理喜剧片《盲探》中首次演绎了一位盲人侦探角色庄士敦,该片为他赢得2013年西班牙锡切斯电影节最佳男主角奖,是刘德华赢得的首个国际影展影帝殊荣[75]。值得一提的是,《盲探》是他自2005年以来所主演的唯一一部纯港产片。同年12月上映的《风暴》由刘德华与江志强联合投资并监制[6],为袁锦麟编导、刘与林家栋主演的一部港产警匪片,他坚持亲自完成大量高难度动作戏[76],其火爆场面被认为可媲美同类型好莱坞电影,而刘演绎的警官吕明哲集人性冲突和善恶于一身,被一些影评人认为是一个突破[77][78][79]。\n\n2015年刘德华在华谊兄弟出品、改编自真人真事、中国女编剧兼作家彭三源编导的电影处女作《失孤》中演绎一名坚持寻子十多年的中国底层农民雷泽宽[80],他的表演成为该片最大的看点,其颠覆性的演出获得普遍肯定[81][82][83],获得第30届金鸡奖最佳男主角提名和第35届香港电影金像奖最佳男主角提名[84][85],赢得第16届华表奖优秀男演员奖[86]。9月上映丁晟编导的中国警匪片《解救吾先生》也同样取材自真实事件,他饰演一名被劫匪绑架后冷静求生的香港影星吾先生,获得第2届丝绸之路国际电影节最佳男演员奖[87]。同年参演张艺谋执导的中美合拍3D魔幻动作巨制《长城》,2016年12月在中国上映。[88]', metadata={'document': 'liudehua.txt'}), Document(page_content='2017年刘德华监制并主演邱礼涛编导的大制作港产警匪片《拆弹专家》,演绎了一位不畏悍匪、忠于职责、敢于牺牲的英雄警察,获得第37届香港电影金像奖最佳男主角提名,赢得首届最港电影大奖最港男演员奖[89]。同年与甄子丹合作在王晶导演的《追龙》中特别演出、继1991年的《五亿探长雷洛传》后再次演绎雷洛一角。2019年继续与邱礼涛合作,监制并与古天乐、苗侨伟和林嘉欣合作主演港产动作片《扫毒2天地对决》,饰演一位从黑道背景成功转型、痛恨毒贩并与昔日兄弟决裂的金融巨子余顺天,中国大陆获取13.12亿人民币成为港产片大陆市场票房冠军[90]。\n\n由关信辉执导、刘德华投资监制于2017年完成拍摄的香港青春励志电影《热血合唱团》在2020年11月公映,刘演绎一位帮助“问题学生”成长进步的音乐指挥老师严Sir。刘德华、刘青云和倪妮主演的《拆弹专家》续集《拆弹专家2》继续由邱礼涛执导、刘德华监制,同年12月上映后票房与口碑都获取佳绩,其演绎的人物性格前后反差巨大的潘乘风一角获得普遍赞誉。刘德华与肖央、万茜合作的黑色幽默剧情片《人潮汹涌》在2021年春节上映,由饶晓志编导、刘德华监制,他演绎了一个因意外失忆而成为努力上进的龙套演员的假杀手周全。\n\n刘德华与吴京、李雪健合作的郭帆执导的科幻巨制《流浪地球2》在2023年春节上映,他演绎了一位不懈追求数字生命的电脑工程师图恒宇,电影获取了很好的口碑与票房。', metadata={'document': 'liudehua.txt'}), Document(page_content='刘德华与吴京、李雪健合作的郭帆执导的科幻巨制《流浪地球2》在2023年春节上映,他演绎了一位不懈追求数字生命的电脑工程师图恒宇,电影获取了很好的口碑与票房。\n\n票房与合作\n电影票房方面,由于刘德华是香港一线影星中拍片数量最多的男演员(1988年到1992年共计达50多部),因此在2005年由香港UA院线主办的“光影梦魅20年暨全港最高票房电影颁奖典礼1985-2005”上[91],他以108部累计约17.3亿港币票房获全港最高票房男演员奖。在2007年由香港国际电影节主办的首届亚洲电影大奖上,刘德华获亚洲电影票房巨星大奖[92]。至今其主演(第一或第二主演)的作品中香港票房超过2000万港元的共有28部,其中有15部超过2500万,分别为《赌神》、《赌侠》、《五亿探长雷洛传》、《整蛊专家》、《烈火战车》、《孤男寡女》、《瘦身男女》、《全职杀手》、《无间道》、《大只佬》、《无间道3》、《门徒 (电影)》、《投名状》、《桃姐》和《拆弹专家》。共有45部刘德华主演的电影进入香港华语片年度票房前十,是票房前十次数最多的香港演员。中国大陆票房超过一亿人民币作品有20部,分别为《十面埋伏》、《天下无贼》、《投名状》、《游龙戏凤》、《狄仁杰之通天帝国》、《新少林寺》、《天机:富春山居图》、《盲探》、《风暴》、《失孤》、《解救吾先生》、《赌城风云III》、《王牌逗王牌》、《拆弹专家》、《侠盗联盟》、《追龙》、《扫毒2天地对决》、《拆弹专家2》、《人潮汹涌》和《流浪地球2》。他主演的作品香港和大陆票房最高的分别为《无间道》(5500万港币)和《流浪地球2》(40.3亿人民币)。', metadata={'document': 'liudehua.txt'}), Document(page_content='在合作对象方面,迄今合作次数最多的导演是多达20多部的王晶;而合作11次的杜琪峰则是与刘德华合作最成功的一位导演,刘德华有多部代表作均出自杜琪峰之手,包括让刘两度金像奖称帝的《暗战》和《大只佬》[93],他同杜琪峰亦是现实中关系较好的朋友。男演员方面,与其关系最好的男艺人有苗侨伟[94][95][96]、黄日华、林家栋等人[97][98]。跟刘德华合作过的女演员有很多,其中合作最多次的是从1988年的《群龙夺宝》开始到1999年拍摄的《卫斯理蓝血人》为止共11次的关之琳,双方因此也在90年代被媒体称作“银幕情侣”[47],2011年1月在他举办的香港演唱会上关之琳作为嘉宾时,刘德华更笑称“我当年真的以为会和她结婚”[99];在90年代,刘德华与吴倩莲演过四次情侣让人印象深刻[47];2000年代以来,与刘德华合作次数最多最默契的为郑秀文,两人从2000年的《孤男寡女》到2013年的《盲探》共七部电影中饰演情侣[47]。此外不得不提的一位女艺人是叶德娴,由于叶德娴与刘德华在其成名电视剧《猎鹰》和《法外情》系列中演绎了感人的母子对手戏,叶德娴因而成为刘德华的干妈并保持着亲密的私人关系[100][101],在2010年刘德华香港跨年个唱上叶德娴还以常驻嘉宾的身份参与了每场演出[102],这对母子搭档在相隔多年之后再次在2011年许鞍华作品《桃姐》中又有精彩感人的合作,并为叶德娴连续赢得威尼斯电影节、德班国际电影节、金马奖、亚洲电影大奖、香港金像奖等九个影后殊荣。', metadata={'document': 'liudehua.txt'}), Document(page_content='为了实现个人的电影梦想,刘德华于1991年成立了属于自己的天幕制作有限公司。首部作品《九一神雕侠侣》由刘德华与梅艳芳主演于1991年12月上映,收获了良好的口碑和2000多万港币票房,该片让天幕公司一举成功[49]。不过之后的《吴三桂与陈园园》、《九二神雕侠侣》、《战神传说》、《天长地久》、《天与地》、《1/2次同床》几部电影票房都不如预期,累计亏损达4000万以上港币,几乎令天幕公司濒临破产,1990年代后期刘德华靠借债、接拍电影、出唱片、开演唱会、做广告代言的收入拿来投资电影才维持住了公司的营运[103]。1997年投资陈果导演的小成本独立电影《香港制造》赢尽口碑[104][105],并获得香港电影金像奖最佳电影、最佳导演[106]以及金马奖最佳导演、最佳编剧等多个大奖[107],之后又合作了《去年烟花特别多》[108],这两部作品是天幕公司仅有的纯文艺片,但是票房也很差。《阿虎》与《爱君如梦》是天幕公司最后的两部作品,都由刘德华主演,前者成为他的演技代表作[45][57],后者是部讲述小人物追求梦想的歌舞喜剧片[109]。', metadata={'document': 'liudehua.txt'}), Document(page_content='2002年刘德华与合伙人麦绍棠发生法律纠纷[110][111],导致刘德华重新成立了一家新公司映艺娱乐有限公司。刘德华吸取了天幕公司的教训,不再拍摄大制作商业片,主要投资小成本的文艺片[112]。2005年余伟国执导的《再说一次我爱你》为映艺首部作品,是刘德华与杨采妮、蔡卓妍合作的一部爱情悲剧电影[113]。2005年启动的“亚洲新星导计划”是专门为扶持新导演的一个电影项目,共资助了大华语地区的六名年轻导演拍摄了六部作品,其中包括台湾的《人鱼朵朵》、中国大陆的《疯狂的石头》、新加坡的《爱情故事》、马来西亚的《太阳雨》,以及香港的两部作品《师奶唔易做》与《得闲饮茶》[114]。这些小成本作品口碑大多不错,而其中影响最大最成功的是宁浩导演的《疯狂的石头》[115],这部黑色喜剧片在内地获得了2300多万的票房[116],也收获了大量的好评和多个奖项[117],并让宁浩导演与郭涛、黄渤、刘桦等演员开始成名并走红[118],后来宁浩于2009年推出的又一部黑色喜剧片《疯狂的赛车》在大陆票房过亿[119]。刘德华对扶持新导演所做的贡献,让他于2006年获得第11届釜山国际电影节颁发的亚洲最有贡献电影人大奖[120],2007年又获得第七届华语电影传媒大奖年度杰出电影人称号。[121]\n\n2007年赵崇基执导的警匪片《兄弟》仿效《五虎将之决裂》以无线五虎演员间的友情为出发点,撮合了苗侨伟、刘德华、黄日华、汤镇业四人另加陈奕迅等人参与演出[122]。2010年郭子健与郑思杰联合编导的《打擂台》是一部向香港电影黄金时代致敬的作品,由一众老艺人泰迪罗宾、梁小龙和陈观泰主演,赢得第三十届香港电影金像奖最佳电影等四个奖项[123]。2011年许鞍华执导的《桃姐》改编自真人故事,刘德华与叶德娴演出了一段朴实感人的主仆情,并呈现出老年人的生存状态,该片收获了广泛的赞誉和许多奖杯的肯定。2013年刘德华投资并监制的校园青春片《初恋未满》是刘娟导演的处女作,获得第16届上海国际电影节“亚洲新人奖”单元评委会特别奖[124]。2013年12月公映的作品《风暴》是由映艺与安乐公司联合投资的一部大制作商业片,为香港首部3D警匪片。[125]2015年客串并参与投资台湾校园青春爱情片《我的少女时代》,该片获取好口碑的同时也在台湾、香港、中国大陆以及新加坡、马来西亚和韩国等地区创造票房佳绩。', metadata={'document': 'liudehua.txt'}), Document(page_content='2015年刘德华与马来西亚成功集团的陈永钦拿督合作成立了一家电影制作公司——梦造者娱乐。该公司在2017年推出邱礼涛执导的《拆弹专家》得到第37届香港电影金像奖最佳电影、最佳导演等七项提名。同年国庆档的《追龙》获得香港金像奖最佳电影等六项提名。2019年暑期档的《扫毒2之天地对决》在中国大陆获取13.12亿人民币票房,创造港产片大陆票房记录。2020年圣诞档上映的《拆弹专家2》在中国大陆获取13.14亿人民币,超越《扫毒2》成为新的港产片大陆市场冠军。\n\n\n歌唱事业\n初入歌坛(1985年-1989年)\n刘德华在与林子祥合演《投奔怒海》期间,有天片场收工后林子祥招呼大家一起唱卡拉OK,林子祥听了刘德华的歌后很是欣赏,于是大加赞赏并鼓励刘德华去唱歌,于是在林子祥的鼓励下刘德华开始发展自己的歌艺[126],因此林子祥可以算是刘德华歌唱事业的伯乐。\n\n1985年刘德华进军乐坛,在香港华纳唱片有意签他为旗下歌手及无线电视高层建议下加盟华星唱片[注 4],推出了第一张专辑《只知道此刻爱你》[127],共包括《只知道此刻爱你》等计13首粤语歌曲,其稚嫩的唱腔未获得很大回响,但与张学友、邝美云一起入围最佳新人奖。1986年转入百代唱片后至1989年这四年间,相继推出了《情感的禁区》、《回到你身边》、《回到你身边&法内情》、《刘德华》、《爱的连线》、《共你伤心过》共计六张唱片[127],其中1987年发行的《情感的禁区》中的同名主打歌《情感的禁区》成为其第一首成功流行的歌曲,1989年《回到你身边&法内情》是其首张国语唱片,1988年《回到你身边》中的《永远记得你》、1989年《刘德华》中翻唱自英文摇滚歌曲的《我恨我痴心》以及1989年《共你伤心过》中的《流浪》这几首粤语歌数年后经常为刘德华所演唱而让歌迷所熟悉。整体上来讲,85至89年这段时期是刘德华在歌坛的探索期,音乐成绩不仅平平,其在歌唱技巧方面与成功歌手也有比较大的差距,演员出身的他在歌坛的发展前景当时并不为外界所看好。[128]', metadata={'document': 'liudehua.txt'}), Document(page_content='全盛期(1990年-2006年)\n1990年在进入宝艺星唱片后,刘德华迎来了歌唱事业的春天[129]。5月发行的《可不可以》销量达三白金,同名主打歌《可不可以》为其赢得香港电台颁发的十大中文金曲奖,是其获得的第一个重要歌曲奖项[130]。同年推出的国语专辑《如果你是我的传说》热卖四白金,主打歌《如果你是我的传说》开始流行于台湾、中国大陆和东南亚等地,刘德华因此获得台湾《民生报》主办的金曲龙虎榜最受欢迎歌手称号,也被认为是成功打入国语歌市场的第一位香港歌手[131]。12月推出另一张粤语专辑《再会了》的同名主打歌赢得90年度TVB颁发的十大劲歌金曲奖,最后更是勇夺十大劲歌金曲最受欢迎男歌星奖[132],让刘德华成为继谭咏麟和张国荣后,又一位获此大奖的男歌手。[133]\n\n1991年6月推出《爱不完》专辑[127],在港年度销量超过四白金(20万张)。9月另一张热卖专辑《一起走过的日子》销量超越四白金(20万张),是91年三张销量最高的专辑之一(另两张为张学友的《一颗不变心》及黎明的《是爱、是缘》)。而《爱不完》及《一起走过的日子》更同时入选宝丽金于1999年推出的《20世纪最强中文大碟》20强(备注:从五十张历年宝系唱片公司最高销量的唱片当中,再经乐迷、音乐人及传媒等….票选出二十张最强大碟)[134]。1992年12月于华纳唱片发行的粤语专辑《真我的风采》达至八白金唱片(即40万张)的销量。1991年和1992年刘德华以大热姿态继续包揽十大劲歌金曲最受欢迎男歌星奖,奠定了其在香港乐坛的偶像地位。在1992年的偶像热潮下,刘德华与张学友、黎明、郭富城被传媒封为“四大天王”[135]。\n\n另一方面,刘德华继续巩固其国语影响力,1991年至1992年相继推出了三张国语大碟《我和我追逐的梦》、《来生缘》和《谢谢你的爱》[127],这些唱片与同名主打歌继续在台湾和中国大陆等地保持热销和流行地位,《来生缘》台湾销量达十白金,刘德华于1992年当选北京电视台最受欢迎歌星奖以及台湾《民生报》主办的“台湾十大偶像选举”第一名,此后刘德华在歌坛事业的红火让其连续五届蝉联这一荣誉(该选举一共举办了1992到1997年六届)[136][137]。1992年刘德华到美国与加拿大举办了八场个人演唱会,成为其首次巡演活动。', metadata={'document': 'liudehua.txt'}), Document(page_content='刘德华于1992年加入飞碟唱片后,相继推出《真情难收》、《答案就是你》、《一生一次》、《爱意》、《忘情水》、《五时三十分》和《天意》这多张唱片[127]。其中《答案就是你》和《五时三十分》成为他的经典粤语唱片,前者包括《答案就是你》、《暗里着迷》、《你是我的梦》、《这一生是给你一个》、《开心的马骝》和《永远寂寞》多首经典歌曲,《永远寂寞》获得93年度十大中文金曲奖[130];后者则有《花花世界》、《口琴别恋》、《谁人知》和《钻石眼泪》这四首主要作品,《谁人知》成为94年度十大劲歌金曲[138]和十大中文金曲双料金曲[130]。1994年发行《忘情水》和《天意》是刘德华的经典国语唱片[136],《忘情水》获得了包括94年度十大劲歌金曲最受欢迎国语歌曲金奖[138]、十大中文金曲奖和优秀国语歌曲金奖,以及华语榜中榜金曲奖在内的许多歌曲大奖,《忘情水》在亚洲销量超过300万张成为当年的大卖作品,也是刘德华本人销量最高的一张唱片[139]。《忘情水》和《天意》在台湾的销量也位列前矛[136]。此外,《一生一次》中的《不能没有你》赢得93年度十大中文金曲奖优秀国语歌曲[130],《爱意》中的《情人Happy Birthday》获得93年度十大劲歌金曲[140]。刘德华又以大热态势拿下1993年度十大劲歌金曲国内最受欢迎香港男歌星和1994年度十大劲歌金曲最受欢迎男歌星奖[138],93年在红磡体育馆举办的20场“真我的风采”演唱会为其第一次香港个唱[141],93年首次在中国大陆的上海[142]、北京[141]、重庆等地展开了23场的室内巡回演唱会[137][143]。1994年再次在香港红馆举办了一连20场的演唱会。此时大红的刘德华受邀参加95年中国中央电视台春节联欢晚会演唱了名曲《忘情水》[144],扩大了自己在中国大陆的知名度和影响力。[128]', metadata={'document': 'liudehua.txt'}), Document(page_content='1995年8月的国语专辑《真永远》是刘德华当年加盟艺能动音后的首张作品,同名主打歌《真永远》获得95年度十大中文金曲和全球华人至尊金曲奖[130],而《爱火烧不尽》是其主演电影《大冒险家》的片尾曲,励志歌曲《今天》后来也广为流传。1995年12月的粤语专辑《情未鸟》中的《情未鸟》成为95年度十大劲歌金曲[145]和十大中文金曲双料金曲[130],另一首代表作《情深的一句》为其主演电影《烈火战车》的主题曲。1996年相继发行了《相思成灾》和《因为爱》两张国语唱片[127],歌曲《相思成灾》获得96年度十大中文金曲奖优秀国语歌曲银奖[130]和新城金心国语歌钻石奖,歌曲《因为爱》获得96年度十大劲歌金曲奖最受欢迎国语歌曲铜奖[146]以及华语榜中榜金曲奖[147]。1996年的粤语唱片《在乎您》主要有《倒转地球》、《一个人睡》和《潮水》三首名曲,前者是刘德华96年在红馆举办的20场演唱会的主题歌,《一个人睡》获得十大劲歌金曲奖[140],《潮水》是较受刘个人喜爱的个人作词作品。此外刘德华于1996年亦录制了歌唱生涯首张且唯一一首日文歌曲《再一次拥抱》(日语:もう一度抱きしめたい),并于日本发行同名EP,于台湾及香港发行同名单曲专辑[148][149]。\n\n1997年的国语专辑《爱如此神奇》主要收集了多首翻唱自其他歌手的经典歌曲,新曲主要有《爱如此神奇》和《中国人》,《爱如此神奇》入选第四届华语榜中榜20大金曲[150],《中国人》是为迎接香港回归、歌颂中华民族的爱国主义歌曲,专辑名列97年度金曲龙虎榜国语大碟专辑第5名[140]。《中国人》后来成为刘德华参加中国大陆晚会和香港回归纪念活动时经常演唱的一首名曲[151][152][153]。1997年12月发行了《真生命》和《爱在刻骨铭心时》两张专辑[127],粤语歌《真生命》成为97年度十大劲歌金曲,国语唱片《爱在刻骨铭心时》则因包括《孤星泪》、《冰雨》、《偷回忆的人》和《世界第一等》四首经典作品而成为其经典唱片,《孤星泪》和《冰雨》后来成为传唱度很高的经典情歌[154][155],《世界第一等》由伍佰创作[156],是刘德华演唱的唯一一首台语歌[157][158]。《爱在刻骨铭心时》成为金曲龙虎榜1998年国语十大专辑之一[140]。', metadata={'document': 'liudehua.txt'}), Document(page_content='1998年发行粤语专辑《你是我的女人》与国语专辑《笨小孩精选》两张唱片[127],前者唱片里包括主打歌《你是我的女人》、《他的女人》等多首刘德华个人填词作品,刘与美国萨克斯大师肯尼·基合作的《你是我的女人》[159]成为98年度十大劲歌金曲和十大中文金曲双料金曲[130],以及98年醉心龙虎榜十大金曲第2位和新城电台年度劲爆歌曲。《笨小孩精选》主要收录历年许多经典国语歌曲,包括《忘情水》、《天意》、《一生一次》和《真情难收》在内的四首歌被新编重唱成另一种味道[160],而新歌《笨小孩》由刘德华与柯受良、吴宗宪合唱[161],是刘德华根据个人经历创作的一首励志歌曲[160],赢得98年度十大劲歌金曲奖最受欢迎国语歌金奖、十大中文金曲奖优秀国语歌曲金奖[130]、劲爆国语歌曲等多个大奖。\n\n1999年上半年推出的国语专辑《人间爱》收录了多首与内地音乐人合作的歌曲,如高枫3首,丁蕾1首,李泉1首,由于融入大量内地流行音乐元素,因此成为一张风格新颖、大陆味道浓重的专辑。其中讲述人生哲理的《木鱼与金鱼》获得99年度十大中文金曲优秀国语歌曲金奖[130],《男朋友》为其主演电影《黑马王子》的主题曲,另外《都怪我》、《会说话的哑巴》和《回家真好》都有一定的流行度;下半年推出粤语专辑《爱无知》获得Music Tower 全年唱片大奖,《爱无知》与《痛》为其中代表作。当年八月他以金发造型在红馆举办一连15场的演唱会[162],主题曲是刘德华为“西藏慈善音乐会”献唱的单曲《爱你一万年》[143],这首大气的抒情歌曲入选99年度十大劲歌金曲最受欢迎国语歌曲金奖和全球华语音乐榜中榜20大金曲,也为刘德华赢得华语音乐榜中榜“跨世纪男歌手”称号[163]。99演唱会影碟的普及使之后来成为歌迷的最爱,为其最经典的一次个唱演出。', metadata={'document': 'liudehua.txt'}), Document(page_content='2000年8月发行国语唱片《男人的爱》由上海音乐才子李泉、香港制作人陈德建、台湾流行音乐强手刘天健及徐德昌等多位顶尖音乐人参与创作,这些制作人分别从不同角度探讨男人的爱[164],主打歌《男人哭吧不是罪》由刘本人填词并唱出了一股很浑厚的男人心声,获得2000年度十大中文金曲奖[130],刘与陈慧琳合唱的《我不够爱你》获得2000年度十大劲歌金曲最受欢迎国语歌曲金奖和中文金曲奖优秀国语歌曲奖金奖[130],以上两首也同时入选全球华语音乐榜中榜20大金曲,刘德华更是赢得华语榜中榜“最受欢迎歌手大奖”称号。此外,《享用我的姓》、《没有你的城市》和《爱情新活力》质量也不俗,令《男人的爱》成为其唱片代表作。12月推出的粤语专辑《心蓝》[165],因包括《心蓝》、《当我遇上你》、《微笑》和《缺陷美》四首主要歌曲成为其粤语唱片代表作,《心蓝》获得香港乐坛评议会最受欢迎年度流行金曲金奖,作为其主演电影《阿虎》主题曲的《当我遇上你》成为2000年度十大劲歌金曲[166],《微笑》为《阿虎》的电影插曲,《缺陷美》为TVB电视《美丽人生》主题曲。\n\n2001年6月发行国语唱片《天开了》,主打歌《我的心只可容纳你》是刘德华为其代言的道地绿茶创作的广告歌,作曲人赵增熹借由弦乐来表现山水的绵延与人类的深情[167],获得01年度十大劲歌金曲最受欢迎国语歌曲铜奖[166]和十大中文金曲奖优秀国语歌曲奖铜奖[130],并入选全球华语音乐榜中榜20大金曲,《踢出个未来》是刘德华为周星驰电影《少林足球》创作的主题曲,获香港电影金像奖最佳原创电影歌曲提名。8月发行的《夏日Fiesta》收录7首歌曲[168],主推的劲歌《夏日Fiesta》是当年8月红馆15场演唱会的主题曲[169],成为01年度十大劲歌金曲奖和十大中文金曲奖双料金曲;其他还包括电影《瘦身男女》插曲《我的伴侣》、《为爱瘦一次》,以及励志的《少林足球》插曲《男儿志》。', metadata={'document': 'liudehua.txt'}), Document(page_content='2002年7月推出的国语唱片《美丽的一天》是刘德华加入加际娱乐后的首张作品[170],包括10首国语和一首粤语歌,歌曲灵感全部来自10个感人的真实故事[170]。《练习》获得十大中文金曲优秀国语歌曲银奖和全国最受欢迎中文流行歌曲银奖[130],以及香港作曲家及作词家协会最广泛演出国语歌曲奖和第三届全球华语歌曲排行榜20大金曲,说唱的《黑蝙蝠中队》入选全球华语音乐榜中榜20大金曲,《天生天养》成为02年度十大中文金曲和十大劲歌金曲双料金曲[166]。该唱片为刘赢得全球华语歌曲排行榜最受欢迎男歌手荣誉,作为刘德华当年发行的唯一一张唱片,自此结束了其一直以来的一年内发行多张唱片的历史,标志着他将事业重心逐渐转向电影领域。\n\n2003年6月发行的《如果有一天》包括9首粤语和一首国语《月老》,其中六首由刘德华参与创作,刘德华作曲填词创作的《如果有一天》为道地绿茶广告歌,借此鼓励非典疫情过后的港人仍要以坚强乐观态度面对逆境[171][172],获得03年度十大劲歌金曲奖[166],另一首主要歌曲《17岁》由刘德华与徐继宗联合作词,回顾了刘从17岁踏入训练班到2002年的演艺生涯。2004年8月推出的又一张粤语专辑《Coffee or Tea》延续了刘德华参与创作六首歌的路线,由他与林夕包揽了所有11首歌曲的填词工作,两人通过对生活、身边事的观察道出自己所体味到的人生感慨[173],道地绿茶广告主题曲《常言道》获得04年度十大中文金曲奖以及十大劲歌金曲奖最受欢迎广告歌曲银奖,《按摩女郎》成为04年度十大劲歌金曲,《影帝无用》与《无须担心》是刘向其粉丝表达的心声之作。04年8月底开始在红馆举办一连15场的“Vision Tour”演唱会[174],随后于同年与2005年在中国的19座城市举办了“Vision Tour”巡回个唱[175]。当年刘德华不仅蝉联十大劲歌金曲奖亚太区最受欢迎香港男歌星,而且还第六次获得最受欢迎男歌星,成为史上首位同时获得这两大荣誉的男歌手[166][176]。', metadata={'document': 'liudehua.txt'}), Document(page_content='时隔三年之后,刘德华于2005年8月又推出一张全情歌的国语唱片《再说一次我爱你》,专辑以一个纯爱故事为架构,用十首歌独特地诠释不同角色对爱情的感受[177]。主打歌《再说一次我爱你》由刘德华与金牌搭档李安修联手填词,为刘德华主演的悲剧爱情片《再说一次我爱你》的电影主题曲,获得05年十大中文金曲奖和优秀流行国语歌曲奖铜奖、05年度十大劲歌金曲奖最受欢迎华语歌曲金奖,以及入选第六届全球华语歌曲排行榜年度20大金曲,该唱片亚洲销量超过150万张[178],并成为全球华语歌曲排行榜最佳专辑,更为刘德华赢得第三次全球华语歌曲排行榜最受欢迎男歌手荣誉[179]。同年底发行的《继续谈情(新曲+精选)》收录28首歌曲,其中新歌主要包括主打的《继续谈情》、道地绿茶广告主题曲《我得你》、电影《无间道》主题曲的独唱版和2005年拜年歌曲《恭喜发财》,《继续谈情》成为05年度十大劲歌金曲[166],《恭喜发财》最早是刘德华在春节联欢晚会上表演的曲目[180],后来成为商家在春节期间经常播放的一首喜庆拜年歌。\n\n2006年8月发行的粤语新碟《声音》是一张关注人性、缓解压力的唱片[181],刘德华填词的《张开眼睛》为道地极品乌龙茶广告歌,获得06年度十大劲歌金曲和最受欢迎广告歌曲金奖,以及RoadShow至尊音乐颁奖礼至尊歌曲;《累斗累》成为06年度十大中文金曲;专辑成为2006年度新城劲爆颁奖礼劲爆创作专辑。其中唯一的一首国语歌《心肝宝贝》是刘德华填词的慈善歌曲,成为中国乙肝防治疾病教育暨首届全国“爱肝日”主题曲[182]。该年度是刘德华最后一次参加十大劲歌金曲和十大中文金曲颁奖礼,标志着音乐事业占其演艺生涯的比重开始明显下调。', metadata={'document': 'liudehua.txt'}), Document(page_content='2007年7月推出涉及爱情、环保、全球暖化、人生态度等多个主题的国语唱片《一只牛的异想世界》,有幽默、欢笑、感伤和温暖等丰富的情感;曲风也很多元化,既有“刘式情歌”,也有软式Hip-Hop的街头舞曲以及R&B。[183]主打的《牧笛》是一首讲述牛郎与织女爱情传说的情歌,方文山填词的《一》是刘德华很少演绎的中国风曲目,赢得07年度RoadShow至尊音乐颁奖礼至尊歌曲,并为刘赢得日本MTV音乐录影带大奖最优秀BuzzAsia大中华区歌手大奖,专辑唯一的粤语歌《只想抱抱》为道地绿茶广告曲,成为07年度新城劲爆颁奖礼劲爆歌曲和劲爆原创广告歌曲。同年12月5日刘德华正式加盟寰亚集团老板林建岳旗下的东亚唱片[184],成为东亚一哥。[185]同时发行新曲加精选集《Everyone is No. 1》[186],主打歌《Everyone is No.1》是刘德华与李安修为2008年北京残奥会创作的奥运歌曲,目的是激励残疾运动员,另一首新歌《一起嗌》是年底红馆16场跨年演唱会的主题曲[187]。2008年在台北、新加坡和悉尼三地各举办了两场海外巡回演唱会。[188]\n\n2009年2月推出的《希望·爱》希望在经济逆境之中带给乐迷一份“希望”和“爱”,包括4首国语歌以及十首粤语新歌共14首歌曲[189],《长途伴侣》、《你是我所有》、《未到伤心处》为其中的代表作,它成为09年度IFPI香港唱片销量大奖十大销量广东唱片。同年7月发行的粤语精选集《长途伴侣》收录了10首道地绿茶广告歌曲[190]。当年“Wonderful World”中国巡回演唱会在广州、合肥等9个城市上演[191],连同07年的呼和浩特、南宁等15站16场在内[192],该系列演唱会一共在24个中国内地城市举行。\n\n至2010年,刘德华发行的新歌专辑有50多张,整个1990年代到2000年代前期,刘一直处于华语歌坛的颠峰状态;2000年代中后期,由于新生代歌手的崛起和其本人年龄的因素,导致新歌影响力不如从前,不过其唱片销量还是一直有一定的保证[178][193][194]。至2000年代,刘德华的唱片销量在各地累计超过4800万张,为华语歌手中的佼佼者[195]。', metadata={'document': 'liudehua.txt'}), Document(page_content="至2010年,刘德华发行的新歌专辑有50多张,整个1990年代到2000年代前期,刘一直处于华语歌坛的颠峰状态;2000年代中后期,由于新生代歌手的崛起和其本人年龄的因素,导致新歌影响力不如从前,不过其唱片销量还是一直有一定的保证[178][193][194]。至2000年代,刘德华的唱片销量在各地累计超过4800万张,为华语歌手中的佼佼者[195]。\n\n在入行30周年之际,为了用自己的歌声诠释那些曾经影响自己的经典作品,刘德华于2010年10月推出了以翻唱许冠杰、邓丽君、蔡琴等人的名曲为主的怀旧专辑《忘不了的》,它以1970年代和80年代的国语、粤语经典老歌为主[196],《掌声响起》、《大眼睛》、《孤儿泪》、《最爱是谁》等20多首老歌都被他唱出了新的味道,当中仅有的两首新歌《珍爱舞台》与《I Don't Wanna Say Goodbye》分别为“Unforgettable”演唱会的国语版主题曲和粤语版主题曲,专辑成为2010年度IFPI香港唱片销量大奖十大销量广东唱片。“Unforgettable”演唱会率先一连20场在2010年底的香港红馆上演[197],之后于2011年4月至5月在北京、郑州、天津等11个城市又展开中国巡回[198][199][200]。2012年在香港发行粤语精选唱片《我们的刘德华》,成为2012年度IFPI香港唱片销量大奖最高销量广东唱片,刘德华也成为全年最高销量香港男歌手[201]。2013年刘德华又开启了以“ALways”为主题的巡回演唱会[202],9月至12月先后在上海、南京、广州、北京、大连和台北这六座城市举办了18场室内个唱[203],据台湾媒体报道,这18场演唱会总票房超过10.5亿新台币(约2.12亿人民币)[203],以场均1170万人民币票房成为年度华语演唱会场均票房的冠军。", metadata={'document': 'liudehua.txt'}), Document(page_content='2015年2月在央视春节联欢晚会上献唱自己填词的亲情歌曲《回家的路》,这是他第四次登上春晚现场表演,距离上次在2005年春晚上演唱《恭喜发财》已有十年之久。[204][205]2018年12月,时隔八年后刘德华再次在香港红馆举行连续20场的跨年演唱会,12月28日因为喉咙发炎而在演出现场宣布取消余下的演出,后来他争取到了2020年2月的红馆档期以便把余下的7场补回来[206],然而2020年1月在武汉爆发的肺炎疫情又令其香港演唱会被迫取消、内地巡回演唱会推迟举行[207][208][209][210],后来又于2021年2月宣布因疫情因素被迫取消内地演唱会[211]。2020年12月,刘德华推出的首张数字专辑《演·唱》上线,由奔跑怪物宣传营销,收录他近年演绎的新作与电影、广告主题曲共17首歌曲,其中由他原唱的13首作品均由他本人亲自作词。[212]\n\n创作及合作\n主条目:刘德华填词作品列表\n刘德华在创作方面主要擅长于填词工作,且主要为个人演唱作品效力,为其他歌手创作的总数只有20多首。他创作的第一首歌是1990年的《如果你是我的传说》,当时是在好友小美的支持和鼓励下才完成的[213]。至今他一共参与了超过150首歌曲的填词工作,其中大多数由个人单独完成,尤其是自2003年以来,他填词的作品占个人专辑的比例明显增多,例如《如果有一天》、《Coffee or Tea》、《再说一次我爱你》、《声音》、《一只牛的异想世界》和《演·唱》这多张唱片他个人填词的都在5首以上。填词是刘德华表达个人想法的一个主要途径,他的早期填词作品如《来生缘》、《谢谢你的爱》、《情人 Happy Birthday》等集中讲爱情,后来慢慢地将话题写得很广阔,写出很多不同风格的歌词,例如1999年的《回家真好》讲述家庭亲情,2000年的《你是我一生中最大的骄傲》是送给FANS的,2003年的《如果有一天》阐释了人生哲理,《17岁》是讲个人的成长经历,2006年的《心肝宝贝》是送给乙肝患者的慈善主题曲。[213]香港著名音乐人黄沾曾批评刘德华填词“不会有什么大成绩”[214][215],后来也夸口称赞刘德华填词有很大进步。[216]', metadata={'document': 'liudehua.txt'}), Document(page_content='刘德华的创作才华也获得了多个奖项的认可:1998年与1999年连续获得商业电台举办的叱咤乐坛流行榜叱咤唱作人大奖,2001年获十大劲歌金曲最受欢迎唱作歌星银奖,2006年获最受欢迎唱作歌星金奖;2006年与2007年连续成为新城劲爆颁奖礼全球劲爆创作歌手。比较知名的优秀个人作品有《绝望的笑容》[213]、《如果你是我的传说》、《来生缘》、《谢谢你的爱》(粤语版)、《这一生是给你一个》、《情深的一句》、《你是我的女人》、《爱你一万年》、《心只有你》、《男人哭吧不是罪》、《当我遇上你》、《心蓝》、《你是我一生中最大的骄傲》等,与别人合填的有《冰雨》、《17岁》、《如果你有事》、《恭喜发财》、《再说一次我爱你》以及《Everyone is No.1》等。同时作词作曲的有《天天想你》(与巫启贤联合作曲)、《如果有一天》、《幸福这么远那么甜》和《余生一起过》[217]等。\n\n杜自持、李安修、陈耀川和陈德建[218]这四位音乐人是刘德华音乐事业上最重要的合作搭档。其中杜自持除了为他作曲及编曲其极大多数的粤语歌曲外,更是刘德华历年来大部分演唱会的音乐总监[219];陈耀川是刘德华90年代的“御用”作曲人,参与作曲的以《忘情水》、《天意》、《真永远》、《相思成灾》、《中国人》最具代表性[220][221];陈德建参与作曲的有《当我遇上你》、《为爱瘦一次》、《我的胖侣》和《Everyone is No.1》等,他也参与了许多刘德华唱片的监制工作;而来自台湾的李安修无疑是刘德华音乐上最亲密的合作伙伴,他不仅参与了《忘情水》、《天意》、《真永远》、《相思成灾》、《中国人》、《木鱼与金鱼》、《练习》、《再说一次我爱你》等多首经典歌曲的作词工作[222],还一直以来长期担任刘德华唱片的总监一职,李安修因此有“刘德华御用创作人”之称。[223]', metadata={'document': 'liudehua.txt'}), Document(page_content='主要奖项\n刘德华获得的流行歌曲奖项已超400个,为至今华语乐坛获奖最多的流行歌手。早在2000年就已经以累计收获292个音乐奖项成为粤语歌手之冠而荣登健力士世界记录当中[4]。其中在无线电视举办的十大劲歌金曲颁奖典礼上累计共有21首歌曲获得十大劲歌金曲奖,其中91年有三首同时获奖,92年与93年各有两首获奖[224],他获得六次最受欢迎男歌星(1990-1992、1994、1999、2004年)和十次亚太区最受欢迎香港男歌星(1993、1995-1996、2000-2006年),这些荣誉皆为男歌手之冠,然而美中不足的是作为歌曲奖最高荣誉的金曲金奖他却一直没有获得过。在香港电台举办的十大中文金曲颁奖音乐会上获得七次全国最受欢迎男歌手奖(2000-2006年)和15次优秀流行歌手大奖(1994到2008年度),从1990到2006年度共有21首半(《无间道》为合唱曲)歌曲获得中文金曲奖[225],仅次于张学友的23首半,另有11首国语歌获得优秀国语歌曲奖,其中金奖有《不能没有你》、《忘情水》、《中国人》、《笨小孩》、《木鱼与金鱼》和《我不够爱你》六首,银奖有《真永远》、《相思成灾》和《练习》三首,铜奖有《我的心只可容纳你》和《再说一次我爱你》这两首。在新城劲爆颁奖礼上他多次成为大赢家,共获得八次“新城全球劲爆歌手奖”、八次“新城劲爆亚洲歌手大奖”以及八次“新城劲爆男歌手奖”,皆为歌手之冠[226];而在新城国语力颁奖礼上他也多次成为国语力歌王和国语力香港歌手大奖得主[227]。以及在1998、1999、2001及2002年度夺得四台联颁音乐大奖传媒大奖歌手奖,四度成为四大音乐颁奖典礼最大赢家。', metadata={'document': 'liudehua.txt'}), Document(page_content='除了香港本土,刘德华也获得了台湾、中国大陆、新加坡和马来西亚、日本与韩国,以及北美一些机构授予的许多流行歌手荣誉[228]。在Channel V主办的全球华语音乐榜中榜上,从1994年至2002年刘德华共有10首歌曲入选榜中榜年度20大金曲,96至98年连续三届获得传媒推荐奖,1999年与2000年分别荣获跨世纪男歌手和最受欢迎歌手大奖[228]。在亚洲七家华语电台共同举办的全球华语歌曲排行榜上,从2001年到2006年他共有6首歌曲入选排行榜20大金曲,并在2002年的第二届、2003年的第三届和2006年的第六届先后三次获得最受欢迎男歌手奖[228],至今为获该荣誉最多的男歌手。其他地区奖项还有:1990年代台湾民生报金曲龙虎榜多届最受欢迎歌手,1992年北京电视台的最受欢迎歌星奖,1993年上海电视台的最受欢迎天王和四川国际电视节最受欢迎歌星奖[228],1993年至1998年连续获日本杂志《Club香港仔》评选的全日本明星人气奖及最受欢迎外国歌手第一名[228],1993年韩国电视台评选的全亚洲最受欢迎男歌手[228],1994年加拿大多伦多美加华语电台至爱男歌手[228],94年、95年、98年、99年和2001年新加坡金曲奖最受欢迎男歌手[228],1995年泰国最受欢迎男歌手,1995年与1996年连续获得Channel V与美国Billboard杂志联合颁发的亚洲最受欢迎歌手奖[229][230],以及1997年澳洲中文广播电台评选的97年度南半球最受欢迎男歌手等等[228]。', metadata={'document': 'liudehua.txt'}), Document(page_content='演唱会\n主条目:刘德华演唱会列表\n1991年,刘德华凭借其在电影方面的影响力,在韩国汉城(今首尔)首尔奥林匹克体操竞技场举办了一场演唱会,这是他举办的首场个人演唱会。1992年赴美国与加拿大举办的八场个唱为其首次巡回演出[188]。1993年1月,首次于红磡体育馆举办了20场的在港个人演唱会[141]。之后1994年与1996年又各举办了20场,1999年、2001年与2004年的夏季各举办15场,2007年、2010年和2018年年底各举办了16场、20场和13场(2018年原定20场,因喉咙发炎被迫取消了7场)的跨年演出[187][197],累计起来目前他已在香港红馆开唱154场。1993年刘德华首次到中国大陆展开了23场的室内巡回演唱会[188],为其首次中国巡演活动。1997年与1998年在内地累计举办20场[188];2000年的中国巡演在济南、沈阳等10个城市展开[188]。2001年与2002年的“夏日Fiesta”巡演合计在武汉、大连、南昌、西安等10个城市举行[188]。2004年至2005年的“Vision Tour”中国巡回在上海、苏州、西安、无锡等19个城市上演[188]。2007年的“Wonderful World”中国巡回从呼和浩特开始到成都结束共在15个城市举办[192],其中上海站一连举办了两场;2009年继续进行了广州、合肥等9个城市的“Wonderful World”中国巡回个唱[191]。2011年在北京、郑州和天津等11站举办“Unforgettable”中国巡回演出[198]。2013年开启的“ALways”中国巡回个唱选择在上海、南京、广州、北京和大连这五座城市的体育馆举行[231],以达到同香港红馆四面台一样的室内效果。至今刘德华已在中国大陆各城市举办了132场个人演唱会,其中上海为其举办场次最多的内地城市。由于创下过许多城市的票房上座和现场火暴记录,刘德华也被一些中国媒体和演出商誉为“华语歌坛票房第一人”[232][233][234][235]。', metadata={'document': 'liudehua.txt'}), Document(page_content='除了香港和中国大陆,刘德华也多次到台湾、新加坡、马来西亚,以及北美的温哥华和多伦多等华人聚集的城市举办演唱会[188]。从1991年到2013年之间除了2006年和2012年外,刘德华每年都举办了多场演唱会,其中1996年以累计举办47场为其演唱会最多的一年[188]。其演唱会顺序大多都是先在香港举办连续多场的个唱,然后再到各地巡演,不过2007年与2013年这两年却以中国巡演为开端,然后才赴其他地区举办。在演出内容上,香港本土以粤语歌曲为主,各地巡演则以国语歌曲为主,而《一起走过的日子》和《忘情水》[128]这两首经典代表作是其演唱频率最多的歌曲。刘德华在每次巡演前都会学习一些新的舞蹈以表演给歌迷[236],如2001年的拉丁舞[169]与2004年的踢踏舞[237]。其演出现场经常以劲歌热舞为开端,中间会安插一些表演和歌唱同时进行的以爱情为主题的音乐剧[238][236][239],而且从头到尾刘德华与歌迷、观众交流互动的机会比较多[157]。由于多年来刘德华陆续演绎了许多首广为流行和传唱的经典歌曲,因此《谢谢你的爱》、《忘情水》、《天意》、《中国人》、《笨小孩》、《冰雨》、《爱你一万年》、《练习》等名曲在个唱上常常会引起集体大合唱[128]。从1994年至今,刘德华已发行11张个唱影碟,其中在香港红馆录制的有1994、1996、1999、2001、2004、2007和2010年共七张,2002年的《你是我的骄傲演唱会》于12月6日在香港伊利沙伯体育馆举办,是为庆祝他入行20年而专门为三千名华仔天地会员举办的一次免费演出[240]。另外三张冠名为中国巡回演唱会的影碟,分别是在2004年的北京工人体育场、2007年和2011年的上海体育场录制的,这开创了歌手在北京和上海这两大能容纳6万名以上观众的体育场发行演唱会影碟的先河,其中北京演唱会不仅入选中国演出家协会评选的“2004中国十大演出盛事”,而且还是2004年中国单场演出票房最高的一场演出[241]。', metadata={'document': 'liudehua.txt'}), Document(page_content='刘德华2018年12月在香港举行红馆演唱会因身体不适被迫腰斩,他其后宣布2020年举办除了7场补场外,还会加开5场演出。[242]2019年9月,刘德华在新加坡演唱会中度过58岁生日,获过万粉丝齐唱生日歌。[243]2022年9月3日晚20点,刘德华在抖音直播间举办了一场“把我唱给你听”线上演唱会,这是他继2021年出道40周年在抖音直播后第二次在抖音直播,从开始的《笨小孩》到最后的《17岁》,2小时的演出的在线观看人数最终达到3.5亿人次,各项观看数据创造了云演唱会的直播记录[244][245][246][247][248][249]。\n\n个人生活\n恋情绯闻\n1981年刘德华当TVB训练班学员时期有一位已交往3年多的圈外初恋女友,却由于聚少离多两人在太平山顶分手(女方提出)。[18]因合作《神雕侠侣》刘德华爱上了“小龙女”陈玉莲,不过在向她表白爱意时被拒,当时她心有所属[250]。1983年秋刘德华到台湾拍张彻电影《上海滩十三太保》,当年的新艺城电影公司公关介绍他与琼瑶的电影公司的艺人喻可欣认识,当时正值走红时期的刘德华公开与喻可欣的恋情,但两人三年后分手[251]。喻可欣撰写的回忆录《情海星空——我与刘德华》于2005年出版,该书披露了当时两人相恋的过程[252][253]。关之琳与刘德华合作了十多部电影,刘曾公开表示欣赏她,更直指对方是他的最佳情人,而关之琳亦曾也间接承认刘德华很帅,评价他是“很全面的演员”,“拍戏时很照顾人……让人很有安全感,是绝种好男人”加上双方的粉丝支持此配对,故绯闻传得闹哄哄;直至1998年,刘坚称两人从没谈过恋爱。[254]', metadata={'document': 'liudehua.txt'}), Document(page_content='家庭生活\n刘德华妻子是马来西亚的闽南人模特儿朱丽倩[255],两人于1986年经刘德华的朋友介绍认识,有传当年是叶倩文介绍,另说是刘德华当时的经纪人张国忠介绍的,因朱丽倩与张国忠是亲戚。1990年代到2000年代媒体不断报导两人交往之消息,但皆未获双方正面承认。2008年两人联名捐款一万元做善事,加上朱丽倩现身刘德华演唱会,因而被疑早已结婚。直到2009年,朱丽倩的父亲于马来西亚过世,刘德华的名字出现在讣告上,二人的关系才正式公开,媒体还证实两人已于2008年在拉斯维加斯注册结婚,刘德华于媒体刊出结婚报道的当日于其官方网站“华仔天地”发表留言《对不起》,表示“我惭愧未能守住我的承诺先告诉大家,让信任我的家人、朋友、媒体朋友难堪,对不起。正在工作当中,一时间不能尽诉,容后向你们说明白——华仔”[256]。\n\n2011年11月28日,刘德华在其官方网站发表一篇名为《报喜》的文章,其中提到“吾家有喜”证实了妻子已怀孕的消息[257]。次年5月9日,朱丽倩在香港养和医院产下一女。5月13日,他在官网以“一切安好”为题向粉丝们报喜,之后为女儿取名为刘向蕙,英文名是“Hanna”,古英文意指“优雅与欢欣的女神”[258],现就读于沪江维多利亚学校[259]。朱丽倩跟刘德华都是虔诚的佛教徒,平时习惯吃素食。刘也承认朱丽倩怀孕至孕后的一段时间,因为月嫂不会准备素食餐,所以所有膳食都是由刘德华和家人处理。[18][260]\n\n兴趣爱好\n刘德华笃信佛教,法名慧果,其师父是台湾灵岩山寺上妙下莲老和尚[261]。为了在香港演唱会上表演二胡演奏,1996年他趁在长春拍电影的空闲时间在当地颇有名气的二胡教授刘汉臣家学习了两个月的二胡演奏[262][263][264]。2000年3月22日,刘德华在北京举行拜师仪式,拜川剧大师彭登怀为师以学习“变脸”绝技[265],并学会了初步的变脸技巧[262]。刘德华在生活中热爱写书法[266]和打保龄球[267],其中他抄写的《心经》更是送给好友梅艳芳的礼物,但在2004年1月1日,即梅艳芳冥寿后两天被拍卖[268]。此外,他亦对造型颇有研究,因为还没出道时刘德华曾做过发型设计师[269]。另外,刘德华坚持每天喝一点混合果汁,比如苹果加红萝卜一起榨的汁,以保持自身的健康[270][271]。', metadata={'document': 'liudehua.txt'}), Document(page_content='主要事件\n遭“无线”雪藏\n1983年,演过《神雕侠侣》在无线电视正当红的刘德华不愿在续约5年的合同上签字,因为他坚信5年中自己的事业会有一个大的飞越。因为TVB不允许他把演艺重心放在电影,他要求公司将年期缩短但遭到了拒绝[18][272]。于是激怒了无线高层的他便遭到了雪藏——没有戏拍和在新闻媒体露脸的机会。那段日子除了偶尔参与体育、邮政、儿童联欢会之类的活动之外,便无主要演出机会。而在这段空闲的日子里,他反复观看自己以前演的电视录像带找出自己的不足,他也观看别人的片子记下别人的长处,然后思索改进自己的表演方法[273]。此外,他还勤练体格时常健身运动、经常练歌学习音乐[274]。期间他也曾数次主动找无线高层,希望通过谈判来化解自己和公司之间的矛盾,但双方一直没有达成共识[272]。\n\n1986年在邵逸夫主席的出面调解下,双方摒弃前嫌,握手言和,签下新合约[274]。而有关这次续约的内容(续约时间、签约剧目、薪酬数额等),双方都没有向外界披露[275]。长达400天的雪藏事件是他出道以来遭受的最大打击[276]。之后他就拼命拍戏、接拍了许多电影,其中以追女仔类型的喜剧片和古惑仔类型的江湖片为主[277]。\n\n与“天幕”的诉讼\n1991年刘德华创立天幕制作有限公司,他从演员转型为幕后投资者,是希望拥有自己的电影公司,可以帮助他拍摄更多不同类型的电影,也圆他的电影梦。起初经营颇为成功,也赚到不少钱。后期,因天幕经营失败令刘德华亏损4000多万港币[103]。2000年麦绍棠以上市公司中建电讯名义注资天幕公司,刘德华签约成为天幕公司旗下艺人。', metadata={'document': 'liudehua.txt'}), Document(page_content='与“天幕”的诉讼\n1991年刘德华创立天幕制作有限公司,他从演员转型为幕后投资者,是希望拥有自己的电影公司,可以帮助他拍摄更多不同类型的电影,也圆他的电影梦。起初经营颇为成功,也赚到不少钱。后期,因天幕经营失败令刘德华亏损4000多万港币[103]。2000年麦绍棠以上市公司中建电讯名义注资天幕公司,刘德华签约成为天幕公司旗下艺人。\n\n2002年,双方的经纪人合约于该年初届满,只剩下合伙关系,但双方合作伙伴关系恶化。刘德华向天幕公司追讨拖欠了他1500万港元的演员酬金,中建电讯透过旗下附属公司Noble Trend International Inc.(NTII)入禀高等法院,控告刘德华及他操控的Ablegate Group Limited(简称AGL)违约,令中建电讯失去出售一批总值1亿5360万港元股份的机会,向刘德华索取上述巨额赔偿。中建电讯更向法院申请禁制令,全面封杀刘德华为其他公司做唱片、接拍影视和广告等演出机会,等于全面封杀刘的演艺事业,结果禁制令成功,使得刘德华在禁制令生效期间估计损失收入上亿元。[111]最终双方在丽新集团老板林建岳的调停下达成和解协议[278]。\n\n承认为乙型肝炎带原者\n2006年8月30日,刘德华以乙型肝炎防治宣传大使身份到北京友谊医院探访两名乙肝及肝癌病人,并送上新碟鼓励他们积极面对病魔。其后他到北京人民大会堂出席“2006肝炎防治宣传教育活动启动”记者会,宣布将担任大使两年,还与林家栋合作拍摄宣传片,由他填词的《心肝宝贝》作主题曲。出席记者会期间刘德华坦承少年时验血后得知自己也是乙肝带原者,当时医生指他还年轻,没有大碍,他说:“预防胜于治疗,这个病患癌比率较高,所以我年年都做身体检查,不过我不太担心,没甚影响。”[279]', metadata={'document': 'liudehua.txt'}), Document(page_content='杨丽娟事件\n主条目:杨丽娟事件\n发生于2007年3月的杨丽娟父亲杨勤冀跳海自杀事件曾轰动一时[280][281]。杨丽娟本是甘肃兰州人,后于1994年迷上了刘德华,此后便沉溺于想见刘德华之中。其父母为达成女儿心愿倾家荡产,父亲还曾卖过肾,并于2007年筹募旅费到香港终于见到刘德华;然而,当3月25日杨丽娟在歌迷会上已如愿见到刘德华并合影后,她却并不满足于只与刘德华合影纪念。次日凌晨,杨父在香港跳海自杀,留下的遗愿只是希望刘德华再单独见女儿一面。刘德华曾于2006年在媒体上斥责杨丽娟让父卖肾是“不忠不孝”[282],事后对杨父的死感到“伤悲”,他也担心以后再发生其他粉丝的疯狂举动,并找心理医生帮忙[283][284]。\n\n该事件发生后引起媒体广泛报道和网友的热议,绝大多数人认为杨丽娟的追星行为太激进太过偏执[285],是导致他父亲自杀的根源[286]。此外也引起许多热议的话题,例如父母对孩子进行家庭教育的重要性[287],年轻人要理智追星首先要有正常的个人生活,追星要学习偶像的优点等等[288][289][290];而一些媒体为了制造吸引目光的报道曾资助过杨丽娟去见刘德华,则引起了公众对媒体就杨丽娟之前报道的方式和过错责任的反思和指责。[291]\n\n勇救歌迷事件\n2007年11月13日,平面媒体以刘德华在电影《天若有情》的角色“华Dee(英雄)上身”,来形容刘德华在11月6日成都演唱会中挥拳意图阻止保安员围殴一位歌迷的事件[292]。根据报导,一位年轻的男歌迷在突破保安的重重屏蔽后来到舞台前,向刘德华献花及跟他握手后,该歌迷就被十多名保安包围及围殴。刘德华在舞台上大声喝止保安的粗鲁行为,然而保安人员未理会,于是刘德华立即由高达两米的高台跳落地面,为歌迷顺利解围并护送离开。刘的此举令全场6万多观众感动和喝彩,该事件经过报道后获得许多网民的热烈反响和赞扬[293]。事后刘德华也重申,歌迷应该遵守场内大会的秩序。[294]\n\n泰国坠马事故\n2017年1月17日,刘德华在泰国南部的寇立为道地饮品拍摄广告片时,出意外从马背上摔了下来,造成盆骨有撕裂伤。当时有数匹马在场,他所骑的马忽然失控,将他抛下,被马蹄踩到腰脊令腰脊骨裂。之后立刻被送去泰国一间医院治疗,因为腰脊受伤,行动不便,必须坐医疗专机回港,再接受香港医生诊治。专机当晚午夜到港,随即送往养和医院接受治疗。[295]', metadata={'document': 'liudehua.txt'}), Document(page_content='泰国坠马事故\n2017年1月17日,刘德华在泰国南部的寇立为道地饮品拍摄广告片时,出意外从马背上摔了下来,造成盆骨有撕裂伤。当时有数匹马在场,他所骑的马忽然失控,将他抛下,被马蹄踩到腰脊令腰脊骨裂。之后立刻被送去泰国一间医院治疗,因为腰脊受伤,行动不便,必须坐医疗专机回港,再接受香港医生诊治。专机当晚午夜到港,随即送往养和医院接受治疗。[295]\n\n2017年3月10日,刘德华宣布出院回家,他表示自己很快就能够站起来。[296]同年8月,为电影《侠盗联盟》进行宣传活动而正式复出工作。\n\n支持东大屿山填海工程\n2018年,刘德华公开为团结香港基金拍摄影片《让下一代看见》[297],片长约三分半钟,他在影片中支持面积1,700公顷的东大屿填海工程,指人工岛填海“可取”。因此他受到一些人士的批评,并指其身为保育大使却谋杀生态环境。其后特首林郑月娥公开表扬刘的支持,对其能够勇于表达意见感到钦佩,惟对刘被一些人侮辱、人身攻击感到不公道,称自己和刘德华都遭到网络欺凌,认为“光有科技知识而无品德道德的人,如网络黑客,对社会构成危险。”[298][299][300]她并祝愿刘的演唱会成功。[301]', metadata={'document': 'liudehua.txt'}), Document(page_content='奥迪广告文案抄袭事件\n2022年5月21日,是中国传统节气“小满”,刘德华在其抖音账号、一汽奥迪在各官方渠道发布了由刘德华主演的视频广告《人生小满》,该视频引发大量关注和转发。当晚,抖音账号“北大满哥”发表视频,称该广告视频涉嫌抄袭他在2021年5月21日的一条视频文案。5月22日,奥迪发布声明称该视频由创意代理公司M&CSaatchi提报并执行,因监管不力、审核不严向刘德华和“北大满哥”道歉并下架广告视频。[302]数小时后,广告创意代理方上思广告声明称视频文案确实抄袭了“北大满哥”的“小满”视频中的文案内容,并向“满哥”道歉;不过有媒体报道显示,拍摄此广告的导演彭杨军还有其他作品涉嫌抄袭(比如2021年8月为BMW8系x良仓制作的创意广告)[303]。同日下午,刘德华在官方后援会华仔天地发文表示:“对原创我是百分百的尊重,今次事件,对于广告团队在创作过程中出现的问题,以及对满哥造成的困扰,我个人深感遗憾。Audi和广告公司现正认真处理中。”[304]5月25日“满哥”表示,两个公司的负责人向他进行了当面道歉,他愿意接受这份道歉。并称三方已达成协议,他将免费授权让广告使用文案。[305][306]\n\n公益活动\n刘德华笃信佛教、热心公益事业,如为1991年华东水灾、1999年台湾921大地震、2001年内蒙古雪灾[307]、2004年印度洋海啸[308]、2008年汶川大地震[309][310]、2009年台湾八八水灾[311]、2010年青海玉树地震[312]、2011年东日本大震灾[313]等举办的各类慈善演出和募捐活动都能看到他积极投入的身影。他也曾先后担任多个组织单位的公益活动大使,并拍摄了不少公益宣传片,如“爱在阳光下—预防艾滋病”公益宣传片、“爱盲行动”公益宣传片和“中国产质量量电子监管网”公益宣传片[314]等等。', metadata={'document': 'liudehua.txt'}), Document(page_content='他本人于1994年成立了“刘德华慈善基金有限公司”,旨在支持弱势社群及帮助有需要的人士[315]。而他对残疾人也非常关心[316],自从1992年巴塞罗那残奥会后,他每年都会拿出10万元港币资助香港残障运动员,他也因此与香港“痉挛飞人”、三届残奥会金牌得主苏桦伟保持着很好的私人关系[317][318]。2007年励志歌曲《Everyone Is NO.1》的MV是他个人出资150万港币花3天时间辛苦拍摄的[319],以此来激励更多伤残人士勇敢生活和拼搏[320]。他对残障运动员的付出也让他于2010年4月当选“中国残疾人福利基金会”理事及副理事长,而在2011年6月则再次被推选为该基金会副理事长[321],2013年12月他又当选为“香港残疾人奥委会暨伤残人士体育协会”副会长[14]。', metadata={'document': 'liudehua.txt'}), Document(page_content='成龙 ,SBS ,MBE PMW(英语:Jackie Chan,1954年4月7日—),原名陈港生,后改名房仕龙,前艺名元楼、元龙,香港动作男演员、武术指导、歌手、导演、编剧和电影监制。原籍山东。其生父为房道龙,其妻子林凤娇为前台湾演员,两人育有一子房祖名。另外艺人吴绮莉与成龙有私生女吴卓林。[5]\n\n成龙于1979年加盟嘉禾公司,填补突然逝世的李小龙,期间拍摄多部电影,屡创佳绩。1998年因何冠昌突然逝世而暂时离开嘉禾。同年年底,经嘉禾集团创办人邹文怀的邀请之下回归嘉禾拍摄《玻璃樽》和《特务迷城》。2001年初被英皇集团挖角并正式离开嘉禾,加盟英皇集团附属的英皇娱乐和英皇电影一直工作至今。成龙以功夫动作喜剧风格、善用环境道具、创新特技动作为名,并自称大部分场面都亲身上阵并以其为卖点[6]。\n\n成龙是少数能够在好莱坞取得成功的华人演员,其多部电影如《尖峰时刻》系列都在美国获得票房成功。[7]他是极少有在国际上家传户晓的华人[8]。2016年获得奥斯卡终身成就奖,为首位获此荣衔的华人。2015年,《福布斯》估值其资产约3.5亿美元。在2016年,成龙是全球收入第二高的男演员[9]。\n\n演艺事业外,成龙亦热心公益事业。2004年担任联合国儿童基金会亲善大使[10]。2006年入选《福布斯》全球十大慈善之星[11]。2009年,成龙受聘成为中国禁毒宣传形象大使。\n\n家庭背景及早期生涯\n成龙原名陈港生,后改名为房仕龙。成龙生于香港太平山,而父亲房道龙1915年生于山东,于9岁赴安徽省和县沈巷镇(今属芜湖市)成长,[12][13]曾在安徽结婚,并育有二子房仕德、房仕胜,1947年独自至香港发展,曾在美国驻港领事馆负责厨务及佣人工作,从母姓(即成龙的祖母)改名“陈志平”,在香港另娶陈月荣,在香港生下成龙。2001年,由其父亲房道龙处知道其祖籍为山东,本姓房。2003年,其子陈祖明回归本姓,改名房祖名。2013年8月31日,成龙回到安徽芜湖沈巷镇,与同父异母哥哥相认,改名房仕龙[14]。', metadata={'document': 'chenglong.txt'}), Document(page_content='成龙曾接受幼稚园教育,并曾入读原位于香港岛坚道的南华中学小学部小学一年级(1959年为止[3])。因脾性顽劣,无心向学,且父亲调职澳洲的一系列原因[15],在其小学一年级未完成时就改被送到中国戏剧学院。在1960年六岁时认京剧武生于占元为义父,寄居位于九龙尖沙咀美丽都大厦的院址,学习京剧与功夫。后组成七小福戏班演出,艺名元楼,为元家班之一。由于后来京剧式微,于占元为了徒弟的前途,鼓励徒弟们参与电影演出,包括李小龙的电影里的替身工作。但1973年李小龙猝死,公司资源大部分转移到粤语喜剧电影那边,武行替身演员大规模失业,成龙一度离开香港到澳洲谋生[16]。\n\n1976年,成龙在澳洲期间,经过经理人陈自强的关系,被当时的电影人罗维看中,随即返港拍摄拍摄《新精武门》时,因李小龙风潮,改艺名为成龙。但当时仍按公司要求模仿李小龙风格,事业发展仍停滞不前[17]。', metadata={'document': 'chenglong.txt'})]

示例代码,

text_splitter.split_text(liudehua)[0]

输出结果示例,

'刘德华,BBS,MH,JP(英语:Andy Lau Tak Wah;1961年9月27日—),香港男演员、歌手、填词人、监制及出品人,1990年代获封为香港乐坛“四大天王”之一[3],也是吉尼斯世界纪录大全中获奖最多的香港歌手[4];在影视方面,他三次获得香港电影金像奖最佳男主角奖,两次获得金马奖最佳男主角奖,至今参演电影超过170部[5]。刘德华是天幕公司和映艺集团的创建者,作为投资人与监制已参与制作了30多部华语电影[6]。除此之外,刘德华是四川省川剧学校客座教授[7]。\n\n1999年,刘德华获得“香港十大杰出青年”的荣誉,2000年11月则顺利荣登“世界十大杰出青年”[8],成为获此殊荣的少数几位香港艺人。2006年7月7日,香港演艺学院因他“是香港最受尊重和喜爱的演艺名人之一,对香港电影及音乐贡献良多。其严谨专业的工作态度,足以成为年轻人的典范”,为了“表彰他在表演艺术方面的成就”而授予刘德华荣誉院士称号[9],他也因此成为少数几位获此荣誉的香港艺人之一[10]。\n\n刘德华笃信佛教,法号“慧果”,热心公益,时常参与慈善活动。2008年,刘德华获香港特别行政区政府委任为太平绅士[11],2010年4月23日,刘德华获任中国残疾人福利基金会理事并担任副理事长[12]。2010年5月2日,刘德华获颁第十二届“世界杰出华人奖”同时获颁授加拿大纽奔驰域蓝仕桥大学荣誉博士学位[13]。2013年12月8日,他又当选香港残疾人奥委会暨伤残人士体育协会副会长[14]。2017年12月他因演艺事业和公益事务上的成就被香港树仁大学授予荣誉文学博士学位。2018年6月受邀加入美国电影艺术与科学学会成为会员[15]。\n\n\n刘德华出生于香港新界大埔泰亨村(旧称菜坑村[注 1])[16],籍贯广东新会县荷塘镇(今江门市)[17]。祖父在当时算是大地主(乡村、农地)[18]。另外,他在家中亦有三姊、一妹和一弟(刘德盛)[19][20][21],自己在家中排行第四[22]。其父刘礼年轻时为启德机场的消防员[16]。'

2-4. Split code

CodeTextSplitter 允许你分割包含多种编程语言的代码。你可以导入 Language 枚举类型,并指定相应的编程语言。

示例代码,

from langchain_text_splitters import (Language,RecursiveCharacterTextSplitter,
)
# Full list of supported languages
[e.value for e in Language]

输出如下,

['cpp','go','java','kotlin','js','ts','php','proto','python','rst','ruby','rust','scala','swift','markdown','latex','html','sol','csharp','cobol','c','lua','perl','haskell']

对于特定语言所使用的分隔符,你也可以查看。

# You can also see the separators used for a given language
RecursiveCharacterTextSplitter.get_separators_for_language(Language.PYTHON)

输出,

['\nclass ', '\ndef ', '\n\tdef ', '\n\n', '\n', ' ', '']

Python

这是一个使用 PythonTextSplitter 的示例,

PYTHON_CODE = """
def hello_world():print("Hello, World!")# Call the function
hello_world()
"""
python_splitter = RecursiveCharacterTextSplitter.from_language(language=Language.PYTHON, chunk_size=50, chunk_overlap=0
)
python_docs = python_splitter.create_documents([PYTHON_CODE])
python_docs

输出,

[Document(page_content='def hello_world():\n    print("Hello, World!")'),Document(page_content='# Call the function\nhello_world()')]

Markdown

这是一个使用 Markdown 的示例,

markdown_text = """
# 🦜️🔗 LangChain⚡ Building applications with LLMs through composability ⚡## Quick Install#```bash
# Hopefully this code block isn't split
pip install langchain
#```As an open-source project in a rapidly developing field, we are extremely open to contributions.
"""
md_splitter = RecursiveCharacterTextSplitter.from_language(language=Language.MARKDOWN, chunk_size=60, chunk_overlap=0
)
md_docs = md_splitter.create_documents([markdown_text])
md_docs

输出,

[Document(page_content='# 🦜️🔗 LangChain'),Document(page_content='⚡ Building applications with LLMs through composability ⚡'),Document(page_content='## Quick Install\n\n```bash'),Document(page_content="# Hopefully this code block isn't split"),Document(page_content='pip install langchain'),Document(page_content='```'),Document(page_content='As an open-source project in a rapidly developing field, we'),Document(page_content='are extremely open to contributions.')]

2-5. MarkdownHeaderTextSplitter

许多聊天或问答应用在嵌入和向量存储之前,都需要对输入文档进行分块。

Pinecone 提供的这些笔记给出了一些有用的建议:

当对整个段落或文档进行嵌入时,嵌入过程会同时考虑整体上下文以及文本中句子和短语之间的关系。这可以生成一个更全面的向量表示,捕捉文本的广泛含义和主题。

正如前面提到的,分块通常旨在将具有共同上下文的文本保持在一起。考虑到这一点,我们可能希望特别遵循文档本身的结构。例如,Markdown 文件是按标题组织的。在特定的标题组内创建分块是一个直观的想法。为了解决这个挑战,我们可以使用 MarkdownHeaderTextSplitter。这将根据指定的一组标题来分割 Markdown 文件。

例如,如果我们想要拆分以下 Markdown 内容:

md = '# Foo\n\n ## Bar\n\nHi this is Jim  \nHi this is Joe\n\n ## Baz\n\n Hi this is Molly' 

我们可以指定用于分割的标题:

[("#", "Header 1"),("##", "Header 2")]

内容按照通用的标题进行分组或拆分:

{'content': 'Hi this is Jim  \nHi this is Joe', 'metadata': {'Header 1': 'Foo', 'Header 2': 'Bar'}}
{'content': 'Hi this is Molly', 'metadata': {'Header 1': 'Foo', 'Header 2': 'Baz'}}

下面让我们来看一些例子。

from langchain_text_splitters import MarkdownHeaderTextSplitter
markdown_document = "# Foo\n\n    ## Bar\n\nHi this is Jim\n\nHi this is Joe\n\n ### Boo \n\n Hi this is Lance \n\n ## Baz\n\n Hi this is Molly"headers_to_split_on = [("#", "Header 1"),("##", "Header 2"),("###", "Header 3"),
]markdown_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on)
md_header_splits = markdown_splitter.split_text(markdown_document)
md_header_splits

输出,

[Document(page_content='Hi this is Jim  \nHi this is Joe', metadata={'Header 1': 'Foo', 'Header 2': 'Bar'}),Document(page_content='Hi this is Lance', metadata={'Header 1': 'Foo', 'Header 2': 'Bar', 'Header 3': 'Boo'}),Document(page_content='Hi this is Molly', metadata={'Header 1': 'Foo', 'Header 2': 'Baz'})]

示例代码,

type(md_header_splits[0])

输出,

langchain.schema.document.Document

默认情况下,MarkdownHeaderTextSplitter 会从输出块的内容中去除被分割的标题。可以通过设置 strip_headers = False 来禁用此功能。

markdown_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on, strip_headers=False
)
md_header_splits = markdown_splitter.split_text(markdown_document)
md_header_splits

输出,

[Document(page_content='# Foo  \n## Bar  \nHi this is Jim  \nHi this is Joe', metadata={'Header 1': 'Foo', 'Header 2': 'Bar'}),Document(page_content='### Boo  \nHi this is Lance', metadata={'Header 1': 'Foo', 'Header 2': 'Bar', 'Header 3': 'Boo'}),Document(page_content='## Baz  \nHi this is Molly', metadata={'Header 1': 'Foo', 'Header 2': 'Baz'})]

在每个 markdown 组内,我们可以应用任何想要的文本分割器。

markdown_document = "# Intro \n\n    ## History \n\n Markdown[9] is a lightweight markup language for creating formatted text using a plain-text editor. John Gruber created Markdown in 2004 as a markup language that is appealing to human readers in its source code form.[9] \n\n Markdown is widely used in blogging, instant messaging, online forums, collaborative software, documentation pages, and readme files. \n\n ## Rise and divergence \n\n As Markdown popularity grew rapidly, many Markdown implementations appeared, driven mostly by the need for \n\n additional features such as tables, footnotes, definition lists,[note 1] and Markdown inside HTML blocks. \n\n #### Standardization \n\n From 2012, a group of people, including Jeff Atwood and John MacFarlane, launched what Atwood characterised as a standardisation effort. \n\n ## Implementations \n\n Implementations of Markdown are available for over a dozen programming languages."headers_to_split_on = [("#", "Header 1"),("##", "Header 2"),
]# MD splits
markdown_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on, strip_headers=False
)
md_header_splits = markdown_splitter.split_text(markdown_document)# Char-level splits
from langchain_text_splitters import RecursiveCharacterTextSplitterchunk_size = 250
chunk_overlap = 30
text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap
)# Split
splits = text_splitter.split_documents(md_header_splits)
splits

输出,

[Document(page_content='# Intro  \n## History  \nMarkdown[9] is a lightweight markup language for creating formatted text using a plain-text editor. John Gruber created Markdown in 2004 as a markup language that is appealing to human readers in its source code form.[9]', metadata={'Header 1': 'Intro', 'Header 2': 'History'}),Document(page_content='Markdown is widely used in blogging, instant messaging, online forums, collaborative software, documentation pages, and readme files.', metadata={'Header 1': 'Intro', 'Header 2': 'History'}),Document(page_content='## Rise and divergence  \nAs Markdown popularity grew rapidly, many Markdown implementations appeared, driven mostly by the need for  \nadditional features such as tables, footnotes, definition lists,[note 1] and Markdown inside HTML blocks.', metadata={'Header 1': 'Intro', 'Header 2': 'Rise and divergence'}),Document(page_content='#### Standardization  \nFrom 2012, a group of people, including Jeff Atwood and John MacFarlane, launched what Atwood characterised as a standardisation effort.', metadata={'Header 1': 'Intro', 'Header 2': 'Rise and divergence'}),Document(page_content='## Implementations  \nImplementations of Markdown are available for over a dozen programming languages.', metadata={'Header 1': 'Intro', 'Header 2': 'Implementations'})]

2-6. Recursively split JSON

这个 JSON 分割器采用深度优先遍历方式遍历 JSON 数据,并构建较小的 JSON 块。它尝试保持嵌套的 JSON 对象完整,但如果需要将块大小保持在最小块大小和最大块大小之间,它会对其进行拆分。如果值不是嵌套的 JSON,而是一个非常大的字符串,则该字符串不会被拆分。如果你需要对块大小进行硬性限制,可以考虑在这些块上使用递归文本分割器。还有一个可选的预处理步骤,通过首先将列表转换为 JSON(字典),然后以这种方式拆分它们。

  • 文本的拆分方式:JSON 值。
  • 块大小的度量方式:字符数。

示例代码,

import jsonimport requests
# This is a large nested json object and will be loaded as a python dict
json_data = requests.get("https://api.smith.langchain.com/openapi.json").json()
from langchain_text_splitters import RecursiveJsonSplitter
splitter = RecursiveJsonSplitter(max_chunk_size=300)
# Recursively split json data - If you need to access/manipulate the smaller json chunks
json_chunks = splitter.split_json(json_data=json_data)
# The splitter can also output documents
docs = splitter.create_documents(texts=[json_data])# or a list of strings
texts = splitter.split_text(json_data=json_data)print(texts[0])
print(texts[1])

输出如下,

{"openapi": "3.0.2", "info": {"title": "LangChainPlus", "version": "0.1.0"}, "paths": {"/sessions/{session_id}": {"get": {"tags": ["tracer-sessions"], "summary": "Read Tracer Session", "description": "Get a specific session.", "operationId": "read_tracer_session_sessions__session_id__get"}}}}
{"paths": {"/sessions/{session_id}": {"get": {"parameters": [{"required": true, "schema": {"title": "Session Id", "type": "string", "format": "uuid"}, "name": "session_id", "in": "path"}, {"required": false, "schema": {"title": "Include Stats", "type": "boolean", "default": false}, "name": "include_stats", "in": "query"}, {"required": false, "schema": {"title": "Accept", "type": "string"}, "name": "accept", "in": "header"}]}}}}

示例代码,

# Let's look at the size of the chunks
print([len(text) for text in texts][:10])# Reviewing one of these chunks that was bigger we see there is a list object there
print(texts[1])

输出如下,

[293, 431, 203, 277, 230, 194, 162, 280, 223, 193]
{"paths": {"/sessions/{session_id}": {"get": {"parameters": [{"required": true, "schema": {"title": "Session Id", "type": "string", "format": "uuid"}, "name": "session_id", "in": "path"}, {"required": false, "schema": {"title": "Include Stats", "type": "boolean", "default": false}, "name": "include_stats", "in": "query"}, {"required": false, "schema": {"title": "Accept", "type": "string"}, "name": "accept", "in": "header"}]}}}}

示例代码,

# The json splitter by default does not split lists
# the following will preprocess the json and convert list to dict with index:item as key:val pairs
texts = splitter.split_text(json_data=json_data, convert_lists=True)
# Let's look at the size of the chunks. Now they are all under the max
print([len(text) for text in texts][:10])

输出如下,

[293, 431, 203, 277, 230, 194, 162, 280, 223, 193]

示例代码,

# The list has been converted to a dict, but retains all the needed contextual information even if split into many chunks
print(texts[1])

输出如下,

{"paths": {"/sessions/{session_id}": {"get": {"parameters": [{"required": true, "schema": {"title": "Session Id", "type": "string", "format": "uuid"}, "name": "session_id", "in": "path"}, {"required": false, "schema": {"title": "Include Stats", "type": "boolean", "default": false}, "name": "include_stats", "in": "query"}, {"required": false, "schema": {"title": "Accept", "type": "string"}, "name": "accept", "in": "header"}]}}}}

示例代码,

# We can also look at the documents
docs[1]

输出如下,

Document(page_content='{"paths": {"/sessions/{session_id}": {"get": {"parameters": [{"required": true, "schema": {"title": "Session Id", "type": "string", "format": "uuid"}, "name": "session_id", "in": "path"}, {"required": false, "schema": {"title": "Include Stats", "type": "boolean", "default": false}, "name": "include_stats", "in": "query"}, {"required": false, "schema": {"title": "Accept", "type": "string"}, "name": "accept", "in": "header"}]}}}}')

convert_lists=True 加之前和加之后的没有变化,原文档可能有bug

2-7. Recursively split by character

这个文本分割器是针对通用文本推荐使用的。它通过一个字符列表进行参数化。它会按顺序尝试根据这些字符进行分割,直到分割后的文本块足够小。默认的字符列表是[“\n\n”, “\n”, " ", “”]。这样做的效果是尽可能地将段落(然后是句子,再然后是单词)保持在一起,因为从通用的角度来看,它们似乎是语义关联最紧密的文本片段。

  • 文本的分割方式:根据字符列表。
  • 文本块大小的衡量标准:字符数量。

示例代码,

# This is a long document we can split up.
with open("./files/liudehua.txt") as f:liudehua = f.read()
from langchain_text_splitters import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(# Set a really small chunk size, just to show.chunk_size=100,chunk_overlap=20,length_function=len,is_separator_regex=False,
)
texts = text_splitter.create_documents([liudehua])
print(texts[0])
print(texts[1])

输出,

page_content='刘德华,BBS,MH,JP(英语:Andy Lau Tak'
page_content='Wah;1961年9月27日—),香港男演员、歌手、填词人、监制及出品人,1990年代获封为香港乐坛“四大天王”之一[3],也是吉尼斯世界纪录大全中获奖最多的香港歌手[4];在影视方面,他三次获得香'

示例代码,

text_splitter.split_text(liudehua)[:2]

输出,

['刘德华,BBS,MH,JP(英语:Andy Lau Tak','Wah;1961年9月27日—),香港男演员、歌手、填词人、监制及出品人,1990年代获封为香港乐坛“四大天王”之一[3],也是吉尼斯世界纪录大全中获奖最多的香港歌手[4];在影视方面,他三次获得香']

Splitting text from languages without word boundaries

有些书写系统没有单词边界,例如中文、日文和泰文。使用默认的分隔符列表[“\n\n”, “\n”, " ", “”]分割文本可能会导致单词在块之间被分割。为了保持单词的完整性,你可以重写分隔符列表,加入额外的标点符号:

  • 添加ASCII句号".“、Unicode全角句号”.“(用于中文)和表意文字句号”。"(用于日文和中文)
  • 添加泰文、缅甸文、高棉文和日文中使用的零宽度空格
  • 添加ASCII逗号",“、Unicode全角逗号”,“和Unicode表意文字逗号”、"

示例代码,

text_splitter = RecursiveCharacterTextSplitter(separators=["\n\n","\n"," ",".",",","\u200B",  # Zero-width space"\uff0c",  # Fullwidth comma"\u3001",  # Ideographic comma"\uff0e",  # Fullwidth full stop"\u3002",  # Ideographic full stop"",],# Existing args
)

2-8. Semantic Chunking

摘自Greg Kamradt精彩的笔记本:5_Levels_Of_Text_Splitting

所有功劳归他。

从高层次来看,这会先将文本拆分成句子,然后将句子分组成每组3个句子,接着在嵌入空间中合并相似的句子组。

示例代码,

# This is a long document we can split up.
with open("../../state_of_the_union.txt") as f:state_of_the_union = f.read()
from langchain_experimental.text_splitter import SemanticChunker
from langchain_openai.embeddings import OpenAIEmbeddings
text_splitter = SemanticChunker(OpenAIEmbeddings())
docs = text_splitter.create_documents([state_of_the_union])
print(docs[0].page_content)

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans. Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution. And with an unwavering resolve that freedom will always triumph over tyranny. Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways. But he badly miscalculated. He thought he could roll into Ukraine and the world would roll over. Instead he met a wall of strength he never imagined. He met the Ukrainian people. From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world. Groups of citizens blocking tanks with their bodies. Everyone from students to retirees teachers turned soldiers defending their homeland. In this struggle as President Zelenskyy said in his speech to the European Parliament “Light will win over darkness.” The Ukrainian Ambassador to the United States is here tonight. Let each of us here tonight in this Chamber send an unmistakable signal to Ukraine and to the world. Please rise if you are able and show that, Yes, we the United States of America stand with the Ukrainian people. Throughout our history we’ve learned this lesson when dictators do not pay a price for their aggression they cause more chaos. They keep moving.

断点
这个分块器通过确定何时"断开"句子来工作。这是通过查看任意两个句子之间的嵌入差异来实现的。当差异超过某个阈值时,它们就会被分割。

确定阈值有几种方法。

  • 百分位数
    默认的分割方式是基于百分位数。在这种方法中,计算所有句子之间的差异,然后任何大于X百分位数的差异都会被分割。

示例代码,

text_splitter = SemanticChunker(OpenAIEmbeddings(), breakpoint_threshold_type="percentile"
)
docs = text_splitter.create_documents([state_of_the_union])
print(docs[0].page_content)

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans. Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution. And with an unwavering resolve that freedom will always triumph over tyranny. Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways. But he badly miscalculated. He thought he could roll into Ukraine and the world would roll over. Instead he met a wall of strength he never imagined. He met the Ukrainian people. From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world. Groups of citizens blocking tanks with their bodies. Everyone from students to retirees teachers turned soldiers defending their homeland. In this struggle as President Zelenskyy said in his speech to the European Parliament “Light will win over darkness.” The Ukrainian Ambassador to the United States is here tonight. Let each of us here tonight in this Chamber send an unmistakable signal to Ukraine and to the world. Please rise if you are able and show that, Yes, we the United States of America stand with the Ukrainian people. Throughout our history we’ve learned this lesson when dictators do not pay a price for their aggression they cause more chaos. They keep moving.

示例代码,

print(len(docs))

输出,

26
  • 标准差分割法
    在这种方法中,任何大于 X 个标准差的差异都会被分割。

示例代码,

text_splitter = SemanticChunker(OpenAIEmbeddings(), breakpoint_threshold_type="standard_deviation"
)
docs = text_splitter.create_documents([state_of_the_union])
print(docs[0].page_content)

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans. Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution. And with an unwavering resolve that freedom will always triumph over tyranny. Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways. But he badly miscalculated. He thought he could roll into Ukraine and the world would roll over. Instead he met a wall of strength he never imagined. He met the Ukrainian people. From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world. Groups of citizens blocking tanks with their bodies. Everyone from students to retirees teachers turned soldiers defending their homeland. In this struggle as President Zelenskyy said in his speech to the European Parliament “Light will win over darkness.” The Ukrainian Ambassador to the United States is here tonight. Let each of us here tonight in this Chamber send an unmistakable signal to Ukraine and to the world. Please rise if you are able and show that, Yes, we the United States of America stand with the Ukrainian people. Throughout our history we’ve learned this lesson when dictators do not pay a price for their aggression they cause more chaos. They keep moving. And the costs and the threats to America and the world keep rising. That’s why the NATO Alliance was created to secure peace and stability in Europe after World War 2. The United States is a member along with 29 other nations. It matters. American diplomacy matters. American resolve matters. Putin’s latest attack on Ukraine was premeditated and unprovoked. He rejected repeated efforts at diplomacy. He thought the West and NATO wouldn’t respond. And he thought he could divide us at home. Putin was wrong. We were ready. Here is what we did. We prepared extensively and carefully. We spent months building a coalition of other freedom-loving nations from Europe and the Americas to Asia and Africa to confront Putin. I spent countless hours unifying our European allies. We shared with the world in advance what we knew Putin was planning and precisely how he would try to falsely justify his aggression. We countered Russia’s lies with truth. And now that he has acted the free world is holding him accountable. Along with twenty-seven members of the European Union including France, Germany, Italy, as well as countries like the United Kingdom, Canada, Japan, Korea, Australia, New Zealand, and many others, even Switzerland. We are inflicting pain on Russia and supporting the people of Ukraine. Putin is now isolated from the world more than ever. Together with our allies –we are right now enforcing powerful economic sanctions. We are cutting off Russia’s largest banks from the international financial system. Preventing Russia’s central bank from defending the Russian Ruble making Putin’s $630 Billion “war fund” worthless. We are choking off Russia’s access to technology that will sap its economic strength and weaken its military for years to come. Tonight I say to the Russian oligarchs and corrupt leaders who have bilked billions of dollars off this violent regime no more. The U.S. Department of Justice is assembling a dedicated task force to go after the crimes of Russian oligarchs. We are joining with our European allies to find and seize your yachts your luxury apartments your private jets. We are coming for your ill-begotten gains. And tonight I am announcing that we will join our allies in closing off American air space to all Russian flights – further isolating Russia – and adding an additional squeeze –on their economy. The Ruble has lost 30% of its value. The Russian stock market has lost 40% of its value and trading remains suspended. Russia’s economy is reeling and Putin alone is to blame. Together with our allies we are providing support to the Ukrainians in their fight for freedom. Military assistance. Economic assistance. Humanitarian assistance. We are giving more than $1 Billion in direct assistance to Ukraine. And we will continue to aid the Ukrainian people as they defend their country and to help ease their suffering. Let me be clear, our forces are not engaged and will not engage in conflict with Russian forces in Ukraine. Our forces are not going to Europe to fight in Ukraine, but to defend our NATO Allies – in the event that Putin decides to keep moving west. For that purpose we’ve mobilized American ground forces, air squadrons, and ship deployments to protect NATO countries including Poland, Romania, Latvia, Lithuania, and Estonia. As I have made crystal clear the United States and our Allies will defend every inch of territory of NATO countries with the full force of our collective power. And we remain clear-eyed. The Ukrainians are fighting back with pure courage. But the next few days weeks, months, will be hard on them. Putin has unleashed violence and chaos. But while he may make gains on the battlefield – he will pay a continuing high price over the long run. And a proud Ukrainian people, who have known 30 years  of independence, have repeatedly shown that they will not tolerate anyone who tries to take their country backwards. To all Americans, I will be honest with you, as I’ve always promised. A Russian dictator, invading a foreign country, has costs around the world. And I’m taking robust action to make sure the pain of our sanctions  is targeted at Russia’s economy. And I will use every tool at our disposal to protect American businesses and consumers. Tonight, I can announce that the United States has worked with 30 other countries to release 60 Million barrels of oil from reserves around the world. America will lead that effort, releasing 30 Million barrels from our own Strategic Petroleum Reserve. And we stand ready to do more if necessary, unified with our allies. These steps will help blunt gas prices here at home. And I know the news about what’s happening can seem alarming.

示例代码,

print(len(docs))

输出结果,

4
  • 四分位数法
    在这种方法中,使用四分位距来分割数据块。

示例代码,

text_splitter = SemanticChunker(OpenAIEmbeddings(), breakpoint_threshold_type="interquartile"
)
docs = text_splitter.create_documents([state_of_the_union])
print(docs[0].page_content)

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans. Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution. And with an unwavering resolve that freedom will always triumph over tyranny. Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways. But he badly miscalculated. He thought he could roll into Ukraine and the world would roll over. Instead he met a wall of strength he never imagined. He met the Ukrainian people. From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world. Groups of citizens blocking tanks with their bodies. Everyone from students to retirees teachers turned soldiers defending their homeland. In this struggle as President Zelenskyy said in his speech to the European Parliament “Light will win over darkness.” The Ukrainian Ambassador to the United States is here tonight. Let each of us here tonight in this Chamber send an unmistakable signal to Ukraine and to the world. Please rise if you are able and show that, Yes, we the United States of America stand with the Ukrainian people. Throughout our history we’ve learned this lesson when dictators do not pay a price for their aggression they cause more chaos. They keep moving.

示例代码,

print(len(docs))

输出,

25

2-9. Split by tokens

语言模型有token限制。你不应超过token限制。当你将文本分割成块时,计算token数量是个好主意。有很多分词器。当你计算文本中的token时,你应该使用与语言模型中相同的分词器。

tiktoken
tiktoken是由OpenAI创建的快速BPE分词器。

我们可以用它来估计使用的token。对于OpenAI模型来说,它可能会更准确。

  • 文本如何分割:按传入的字符分割。
  • 块大小如何衡量:通过tiktoken分词器衡量。

示例代码,

# This is a long document we can split up.
with open("../../state_of_the_union.txt") as f:state_of_the_union = f.read()
from langchain_text_splitters import CharacterTextSplitter

.from_tiktoken_encoder() 方法接受编码作为参数(例如 cl100k_base),或者模型名称(例如 gpt-4)。所有额外的参数,如 chunk_size、chunk_overlap 和 separators,都用于实例化 CharacterTextSplitter:

text_splitter = CharacterTextSplitter.from_tiktoken_encoder(encoding="cl100k_base", chunk_size=100, chunk_overlap=0
)
texts = text_splitter.split_text(state_of_the_union)
print(texts[0])

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans.  Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution.

请注意,如果我们使用 CharacterTextSplitter.from_tiktoken_encoder,文本只会被 CharacterTextSplitter 分割,而 tiktoken 分词器用于合并分割后的文本。这意味着分割后的文本可能会大于由 tiktoken 分词器测量的块大小。我们可以使用 RecursiveCharacterTextSplitter.from_tiktoken_encoder 来确保分割后的文本不会超过语言模型允许的令牌块大小,其中每个分割如果超过了大小限制,将被递归地进一步分割:

示例代码,

from langchain_text_splitters import RecursiveCharacterTextSplittertext_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(model_name="gpt-4",chunk_size=100,chunk_overlap=0,
)

我们可以直接加载一个 tiktoken 分词器,这样可以确保每个分割后的文本块都小于指定的块大小。

from langchain_text_splitters import TokenTextSplittertext_splitter = TokenTextSplitter(chunk_size=10, chunk_overlap=0)texts = text_splitter.split_text(state_of_the_union)
print(texts[0])

有些书面语言(如中文和日语)的字符可以编码成两个或更多的标记(token)。直接使用 TokenTextSplitter 可能会将一个字符的标记分割到两个不同的文本块中,导致 Unicode 字符格式错误。请使用 RecursiveCharacterTextSplitter.from_tiktoken_encoder 或 CharacterTextSplitter.from_tiktoken_encoder 以确保文本块包含有效的 Unicode 字符串。

spaCy

spaCy是一个开源的软件库,用于高级自然语言处理,使用Python和Cython编程语言编写。

除了NLTK之外,另一种选择是使用spaCy分词器。

  • 文本的拆分方式:通过spaCy分词器。
  • 文本块大小的衡量方式:通过字符数量。

示例代码,

# This is a long document we can split up.
with open("../../state_of_the_union.txt") as f:state_of_the_union = f.read()
from langchain_text_splitters import SpacyTextSplittertext_splitter = SpacyTextSplitter(chunk_size=1000)
texts = text_splitter.split_text(state_of_the_union)
print(texts[0])

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman.Members of Congress and the Cabinet.Justices of the Supreme Court.My fellow Americans.  Last year COVID-19 kept us apart.This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents.But most importantly as Americans. With a duty to one another to the American people to the Constitution. And with an unwavering resolve that freedom will always triumph over tyranny. Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways.But he badly miscalculated. He thought he could roll into Ukraine and the world would roll over.Instead he met a wall of strength he never imagined. He met the Ukrainian people. From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world.

SentenceTransformers

SentenceTransformersTokenTextSplitter 是一个专门用于句子转换器模型的文本分割器。它的默认行为是将文本分割成适合你想要使用的句子转换器模型的令牌窗口大小的块。

示例代码,

from langchain_text_splitters import SentenceTransformersTokenTextSplitter
splitter = SentenceTransformersTokenTextSplitter(chunk_overlap=0)
text = "Lorem "
count_start_and_stop_tokens = 2
text_token_count = splitter.count_tokens(text=text) - count_start_and_stop_tokens
print(text_token_count)

输出,

2

示例代码,

token_multiplier = splitter.maximum_tokens_per_chunk // text_token_count + 1# `text_to_split` does not fit in a single chunk
text_to_split = text * token_multiplierprint(f"tokens in text to split: {splitter.count_tokens(text=text_to_split)}")

输出,

tokens in text to split: 514

示例代码,

text_chunks = splitter.split_text(text=text_to_split)print(text_chunks[1])

输出,

lorem

NLTK

自然语言工具包(Natural Language Toolkit),通常简称为NLTK,是一套用Python编程语言编写的用于英语符号和统计自然语言处理(NLP)的库和程序。

我们可以使用NLTK来根据NLTK分词器进行分割,而不仅仅是基于""进行分割。

  • 文本的分割方式:通过NLTK分词器。
  • 文本块大小的衡量方式:通过字符数量。

示例代码,

# This is a long document we can split up.
with open("../../state_of_the_union.txt") as f:state_of_the_union = f.read()
from langchain_text_splitters import NLTKTextSplittertext_splitter = NLTKTextSplitter(chunk_size=1000)
texts = text_splitter.split_text(state_of_the_union)
print(texts[0])

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman.Members of Congress and the Cabinet.Justices of the Supreme Court.My fellow Americans.Last year COVID-19 kept us apart.This year we are finally together again.Tonight, we meet as Democrats Republicans and Independents.But most importantly as Americans.With a duty to one another to the American people to the Constitution.And with an unwavering resolve that freedom will always triumph over tyranny.Six days ago, Russia’s Vladimir Putin sought to shake the foundations of the free world thinking he could make it bend to his menacing ways.But he badly miscalculated.He thought he could roll into Ukraine and the world would roll over.Instead he met a wall of strength he never imagined.He met the Ukrainian people.From President Zelenskyy to every Ukrainian, their fearlessness, their courage, their determination, inspires the world.Groups of citizens blocking tanks with their bodies.

Hugging Face tokenizer

Hugging Face 有许多分词器。

我们使用 Hugging Face 的分词器 GPT2TokenizerFast 来统计文本的 token 长度。

  • 文本的拆分方式:按照传入的字符。
  • 文本块大小的衡量方式:通过 Hugging Face 分词器计算得到的 token 数量。

示例代码,

from transformers import GPT2TokenizerFasttokenizer = GPT2TokenizerFast.from_pretrained("gpt2")
# This is a long document we can split up.
with open("../../../state_of_the_union.txt") as f:state_of_the_union = f.read()
from langchain_text_splitters import CharacterTextSplitter
text_splitter = CharacterTextSplitter.from_huggingface_tokenizer(tokenizer, chunk_size=100, chunk_overlap=0
)
texts = text_splitter.split_text(state_of_the_union)
print(texts[0])

输出,

Madam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans.  Last year COVID-19 kept us apart. This year we are finally together again. Tonight, we meet as Democrats Republicans and Independents. But most importantly as Americans. With a duty to one another to the American people to the Constitution.

3. 评估文本拆分器

您可以使用 Greg Kamradt 创建的 Chunkviz or Chunkviz 实用程序来评估文本拆分器。 Chunkviz 是可视化文本拆分器工作方式的绝佳工具。它将向您显示文本是如何被拆分的,并帮助调整拆分参数。

4. 其他文档转换

文本分割只是在将文档传递给 LLM 之前对其进行转换的一个例子。请前往"集成"页面,查看内置文档转换器与第三方工具集成的文档。

在这里插入图片描述

refer: https://python.langchain.com/docs/modules/data_connection/document_transformers/

完结!

相关文章:

  • 在虚拟机尝试一次用启动盘重装系统
  • P1162 填涂颜色
  • Bigtable [OSDI‘06] 论文阅读笔记
  • 第四题:扫雷
  • C语言关于随机数知识点的总结
  • LeetCode 5. 最长回文子串
  • 云原生:应用敏捷,华为视角下的应用现代化
  • 黑马鸿蒙笔记
  • 力扣热题100_链表_138_随机链表的复制
  • Acwing2024蓝桥杯区间合并
  • 34-3 SSRF漏洞 - ssrf业务场景及挖掘
  • Ubuntu下TexStudio如何兼容中文
  • 简析数据安全保护策略中的十个核心要素
  • 【精品整理】最新数据安全评估标准合集
  • 基于单片机钢琴电子节拍器系统设计
  • @jsonView过滤属性
  • [nginx文档翻译系列] 控制nginx
  • Consul Config 使用Git做版本控制的实现
  • HashMap ConcurrentHashMap
  • Java知识点总结(JavaIO-打印流)
  • k个最大的数及变种小结
  • Material Design
  • node.js
  • spring boot下thymeleaf全局静态变量配置
  • 前端临床手札——文件上传
  • 我看到的前端
  • 原创:新手布局福音!微信小程序使用flex的一些基础样式属性(一)
  • 自制字幕遮挡器
  • Spark2.4.0源码分析之WorldCount 默认shuffling并行度为200(九) ...
  • 不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用 ...
  • ​一帧图像的Android之旅 :应用的首个绘制请求
  • #NOIP 2014# day.1 生活大爆炸版 石头剪刀布
  • $jQuery 重写Alert样式方法
  • (007)XHTML文档之标题——h1~h6
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (Redis使用系列) Springboot 在redis中使用BloomFilter布隆过滤器机制 六
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (第9篇)大数据的的超级应用——数据挖掘-推荐系统
  • (二)基于wpr_simulation 的Ros机器人运动控制,gazebo仿真
  • (二)正点原子I.MX6ULL u-boot移植
  • (分类)KNN算法- 参数调优
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理 第13章 项目资源管理(七)
  • (一)80c52学习之旅-起始篇
  • (转)memcache、redis缓存
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .form文件_一篇文章学会文件上传
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .net core 6 使用注解自动注入实例,无需构造注入 autowrite4net
  • .net 发送邮件
  • .NET 实现 NTFS 文件系统的硬链接 mklink /J(Junction)
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)...
  • .NET/C# 阻止屏幕关闭,阻止系统进入睡眠状态
  • .NET面试题(二)
  • .net实现客户区延伸至至非客户区